﻿VLADSTON FERREIRA FILO MINIM TEORETIC ON CALCULATOR Wladston Ferreira Filho ÎNVĂȚAȚI ARTA REZOLVĂRII PROBLEMELOR COMPUTATIONALE ctxieenergy Vladston Ferreira Philo TOT CE TREBUIE UN PROGRAMATOR ȘI UN DEZVOLTATOR C^PPTER" Sankt Petersburg * Moscova * Ekaterinburg * Voronezh Nijni Novgorod * Rostov-pe-Don Samara • Minsk BBK - UDC F F Minim teoretic în Informatică Tot ce are nevoie un programator și dezvoltator - Sankt Petersburg: Peter, - p : ill - (Seria "Biblioteca programatorului") ISBN - - - - Nu mai pierdeți timpul cu volume academice plictisitoare! Studiul informaticii poate fi distractiv și interesant Vladston Ferreira Philo ne introduce în gândirea computațională, care ne permite să rezolvăm orice probleme complexe Este ușor să înveți să scrii cod - câteva săptămâni la cursuri și ești un "programator", dar pentru a deveni un profesionist care va fi solicitat oricând și oriunde, ai nevoie de cunoștințe fundamentale Aici veți găsi doar cele mai importante informații de care fiecare dezvoltator și programator are nevoie în fiecare zi + (În conformitate cu Legea federală din decembrie nr -FZ ) BBK - UDC Toate drepturile rezervate Nicio parte a acestei cărți nu poate fi reprodusă sub nicio formă fără permisiunea scrisă a deținătorilor drepturilor de autor Informațiile conținute în această carte au fost obținute din surse considerate de către editor a fi de încredere Totuși, având în vedere eventualele erori umane sau tehnice, editorul nu poate garanta acuratețea și caracterul complet al informațiilor furnizate și nu este responsabil pentru eventualele erori asociate cu utilizarea cărții ISBN - ISBN - ^ - - (c) Computer Science Distilled, Wladston Ferreira Filho, (c) Traducere în limba rusă de către Editura Piter LLC, (c) Ediția rusă, proiectat de Editura Piter LLC, (c) Seria "Biblioteca Programatorului", unsprezece Aceasta carte este pentru mine? Dar nu este informatica doar pentru oameni de știință? Idei Diagrame bloc Pseudocod Modele matematice Logică Operatori Algebră booleană Tabelele de adevăr Logica în calcul Combinatorică Regula înmulțirii Permutări Permutări fără repetare Combinaţii Regula de însumare Probabilitate Numărarea numărului de opțiuni posibile Evenimente independente (comunite) Evenimente incompatibile Evenimente complementare "Concepție greșită a jucătorului" Probabilităţi mai complexe Rezumat Resurse utile Cuprins Sper la ce este mai bun, dar pregătiți-vă pentru ce e mai rău Estimarea timpului estimat Înțelegerea costurilor în creștere Notația "O mare" Timp exponenţial Estimarea costurilor de memorie Rezumat Resurse utile Iterație Bucle imbricate și seturi de putere Recursiune Recursiune vs Iterații Enumerarea completă Căutare (forță brută) cu întoarcere Algoritmi euristici Algoritmi lacomi Când lăcomia învinge puterea Împărțiți și cuceriți Împărțire și sortare Împărțiți și faceți o înțelegere Împărțiți și împachetați Programare dinamică Memorarea Fibonacci Memorarea obiectelor din rucsac Cea mai bună ofertă de jos în sus Ramuri și limite Limitele superioare și inferioare Ramuri și limite în problema rucsacului Rezumat Resurse utile Abstracția Tip de date Cuprins Tipuri de date abstracte Beneficiile utilizării unui ADT Abstracţii generale Tipuri de date primitive Grămadă Coada Coada de prioritate Listă Lista sortată Mulți Structuri Matrice Lista legată Listă dublu legată Arrays vs Linked Lists Lemn Arborele de căutare binar Heap binar Grafic Tabel hash Rezumat Resurse utile Sortare Căutare Numărări Căutarea în grafice Colorarea graficelor Găsirea căilor într-un grafic PageRank Cercetare operațională Probleme de optimizare liniară Probleme legate de debitul maxim în Rețea Rezumat Resurse utile Cuprins Model relaţional Relaţii Migrarea schemei SQL Indexare Tranzacţii Model non-relațional Arhivele de documente Magazine de valori-cheie Baze de date grafice Big Data SQL vs NoSQL Model distribuit Replicare cu un singur master Replicarea cu mai mulți master Fragmentarea Consecvența datelor Model geografic Formate de serializare Rezumat Resurse utile Arhitectură Memorie Procesor Compilatoare Sisteme de operare Optimizarea compilatorului Limbaje de scripting Dezasamblare și inginerie inversă Software cu sursă deschisă Ierarhia memoriei Decalajul dintre memorie și procesor Localitate temporală şi spaţială Cuprins Cache L Cache L Primar vs Secundar Memoria externă şi terţiară Tendințe în tehnologia memoriei Rezumat Resurse utile Lingvistică Valori Expresii Instructiuni Variabile Tastarea variabilei Sfera variabilelor Paradigme Programare imperativă Programare declarativă Programare logică Rezumat Resurse utile I Sisteme numerice II Metoda Gauss III Seturi IV Algoritmul lui Kadain Prietenii sunt familia pe care o alegem pentru noi Dedic cartea prietenilor mei Romulo, Leo, Moto și Chris, care m-au îndemnat constant să-l termin în sfârșit Știu că doi și doi sunt egal cu patru și m-aș bucura să demonstrez asta dacă aș putea - deși trebuie să spun că dacă aș putea transforma doi și doi în cinci, mi-ar face mult mai multă plăcere Lord Byron, dintr-o scrisoare către viitoarea sa soție Annabella ( ) Fiica lor Ada Lovelace a devenit primul programator de computere Toată lumea din țara noastră ar trebui să învețe să programeze, pentru că te învață să gândești Steve Jobs Când computerele au început să schimbe lumea, deschizând oportunități fără precedent pentru oameni, o nouă știință a înflorit - informatica Ea a arătat cum să folosească computerele pentru a rezolva probleme Acest lucru ne-a permis să folosim întregul potențial al computerelor Și am obținut rezultate uimitoare, doar nebunești Informatica este peste tot, dar este încă predată ca o teorie plictisitoare Mulți programatori nici nu l-au învățat! Cu toate acestea, este esențial pentru o programare eficientă Unii dintre prietenii mei nu găsesc un programator bun de angajat Puterea de calcul este abundentă astăzi, dar oamenii care o pot folosi sunt puțini cuvânt înainte Știi, cutia de metal cu ailoil este plină de lumini Îmi petrec cea mai mare parte a vieții apăsând butoane pentru a face modelul luminilor să se schimbe așa cum vreau eu Dar astăzi modelul este oarecum diferit Dumnezeu! Încercați să apăsați alte butoane! Sarcini de calculator Această carte este încercarea mea umilă de a ajuta lumea și, de asemenea, de a vă încuraja să utilizați computerele în mod eficient Prezintă conceptele informaticii într-o formă simplă Am păstrat detaliile științifice la minimum Sperăm că informatica te impresionează și codul tău devine mai bun Dacă vrei să spargi probleme precum nucile, găsind soluții eficiente, atunci această carte este pentru tine Ai nevoie doar de puțină experiență în scrierea codului Dacă ați făcut vreodată acest lucru și puteți distinge între afirmațiile elementare precum for și while, atunci totul este în ordine În caz contrar, vei găsi tot ce ai nevoie (și mai mult) în cadrul unor cursuri de programare online Puteți finaliza un astfel de curs în doar o săptămână și, mai mult, gratuit Pentru cei care sunt deja familiarizați cu informatica, această carte va fi o recenzie excelentă a trecutului și va ajuta la consolidarea cunoștințelor Imagine folosită cu permisiunea de la http://xkcd com A se vedea, de exemplu, http://code energy/coding-courses Dar nu este informatica doar pentru oameni de știință? Această carte este pentru toată lumea Este vorba despre gândirea computațională Veți învăța cum să transformați problemele în sisteme calculabile Veți folosi, de asemenea, gândirea computațională în sarcinile de zi cu zi Preluarea și stocarea în cache vă vor ajuta să simplificați procesul de împachetare a lucrurilor Stăpânind paralelismul, vei deveni mai eficient în bucătărie Și, desigur, codul tău va fi uimitor Fie ca forța să fie cu tine! Vlad Informatica nu este mai mult stiinta calculatoarelor decat astronomia este stiinta telescoapelor Informatica este indisolubil legata de matematica Edsger Dijkstpra computerele au nevoie de noi pentru a împărți sarcinile în bucăți ușor de gestionat Aici avem nevoie de ceva matematică Nu intrați în panică, aceasta nu este matematică avansată - scrierea unui cod bun necesită rareori cunoașterea ecuațiilor complexe În Capitolul veți găsi un set de instrumente pentru rezolvarea diferitelor probleme O sa inveti: idei de model în organigrame și pseudocod; distinge binele de rău folosind logica; ♦ Efectuați calcule, calculați cu încredere probabilități Acest lucru este suficient pentru a traduce gândurile în soluții calculabile Idei Când te confrunți cu o sarcină dificilă, ridică-te peste complexitatea ei și pune pe hârtie toate cele mai importante lucruri Memoria de lucru a creierului uman este ușor copleșită de fapte și idei Multe abordări ale organizării muncii presupun prezentarea gândurilor în scris Există mai multe moduri de a face acest lucru În primul rând, ne vom uita la modul de utilizare a diagramelor de flux pentru a reprezenta procesele Apoi vom învăța cum să construim procese programabile în pseudocod De asemenea, vom încerca să modelăm o problemă simplă folosind formule matematice Când dezvoltatorii Wikipedia au discutat despre cum să organizeze munca în echipă, au creat o diagramă de discuții Este mai ușor să negociezi dacă toate inițiativele sunt în fața ochilor tăi și sunt combinate într-o imagine comună (Fig ) Codul computerului, ca și procesul de editare a unei pagini wiki din imaginea de mai sus, este în esență un proces Programatorii folosesc adesea diagrame de flux pentru a reprezenta procesele de calcul pe hârtie Pentru ca alții să vă înțeleagă diagramele, trebuie să urmați aceste instrucțiuni : scrieți stări și instrucțiuni în interiorul dreptunghiurilor; înregistrează luarea deciziilor, când procesul poate merge în moduri diferite, în interiorul diamantelor; nu combina niciodată instruirea cu luarea deciziilor; Adaptarea schemei de pe site-ul http://wikipedia org Capitolul Bazele conectați fiecare pas următor cu cel anterior cu o săgeată; marchează începutul și sfârșitul procesului Procesul editorial la Wikipedia A se vedea, de exemplu, http://code energy/coding-courses Idei Luați în considerare întocmirea unei organigrame folosind exemplul problemei găsirii celui mai mare dintre cele trei numere (Fig ) Găsirea celui mai mare dintre trei numere La fel ca diagramele de flux, pseudocodul exprimă procese de calcul Pseudocodul este un cod convenabil pentru percepția noastră, dar de neînțeles pentru mașină Următorul exemplu arată același proces ca în Fig Țineți un minut și verificați cum funcționează cu diferite valori ale lui A, B și C Aici B dacă A > C max "-A altfel max "-C altfel dacă B > C max "- In altfel max "-C prinț max Observați că acest exemplu ignoră complet regulile de sintaxă ale limbajelor de programare? Puteți chiar să inserați fraze colocviale în pseudocod! Când scrieți pseudocod, lăsați-vă mintea creativă să curgă, la fel ca atunci când scrieți diagrame de flux (Figura " ") Aplicarea pseudocodului în viața reală Instrument pentru descrierea algoritmilor Un instrument folosit de programatorii din primul an pentru a-și exprima gândurile stupide Derp Toknson (c)Derpjjohn vjhile (iympo'){ alcool++ tanuy++ } #moyazhiz #da-te din fund U $[MO |ctp com] Pseudocod în viața reală Un model este un set de idei care descriu o problemă și proprietățile acesteia Modelul ajută la raționament și la luarea deciziilor cu privire la problemă Modelarea este atât de importantă încât sunt predate la școală deoarece la matematică trebuie să știi să rezolvi secvențial ecuații și să faci alte operații cu numere și variabile Prin amabilitatea http://ctp com Idei Modelele matematice au marele avantaj că pot fi adaptate la calculatoare folosind metode matematice bine definite Dacă modelul dvs se bazează pe grafice, utilizați teoria graficelor Dacă implică ecuații, folosiți algebra Stai pe umerii giganților care au creat aceste instrumente și îți vei atinge scopul Să vedem cum lucrează cu o problemă tipică de liceu X" * Ferma EIA conține două tipuri de animale domestice Aveți de bobine de sârmă pentru a construi un pix dreptunghiular și un despărțitor în interiorul acestuia care separă unele animale de altele Cum să ridicați un gard astfel încât zona de pășune să fie maximizată? Să începem cu ce anume trebuie determinat; w și I sunt dimensiunile pășunii; w x I este aria sa A face suprafața cât mai mare posibil înseamnă a folosi tot firul, așa că stabilim o relație între w și / pe de o parte, și de țevi pe de altă parte: W A = wx I = w + / Alegem w și / pentru care aria A va fi maximă Înlocuind / din a doua ecuație / = - (r) mai întâi, obținem: l YuO A \u d w - w Capitolul Bazele Da, este o ecuație pătratică! Maximul său este ușor de găsit folosind formula pentru rădăcinile unei ecuații pătratice, care este predată în liceu Ecuațiile cuadratice sunt la fel de importante pentru un programator pe cât este o oală lentă pentru un bucătar Ele economisesc timp Ecuațiile cuadratice te ajută să rezolvi multe probleme mai rapid, iar acesta este cel mai important lucru pentru tine Bucătarul își cunoaște uneltele, tu ar trebui să le cunoști pe ale tale Modelarea matematică este pur și simplu necesară pentru tine Și ai nevoie și de logică Programatorii trebuie să se confrunte cu probleme logice atât de des încât îi înnebunesc Cu toate acestea, de fapt, mulți dintre ei nu au studiat logica și o folosesc inconștient După ce stăpânim logica formală, o putem folosi în mod conștient pentru a rezolva probleme VIAȚA UNUI PROGRAMATOR emițător șir; expeditor = "Joseph F"; Nu voi înțelege niciodată femeile Nimeni nu le poate / înțelege Și de ce mi-a vorbit? J Su Da, soția trimisă la piață, Tomatoes urlă acolo, a spus: "Cumpără șase ouă Ei bine, am luat nouă ouă Dacă există roșii - nu înțeleg de ce ea cumpără nouă jj s-a supărat ai unu Logica programatorului Prin amabilitatea http://programmers life Logice În primul rând, vom experimenta cu instrucțiuni și operatori logici Apoi vom învăța cum să rezolvăm problemele cu tabelele de adevăr și vom vedea cum computerele se bazează pe logică În matematică, variabilele și operatorii (+, x, ) sunt utilizați pentru modelarea problemelor numerice În logica matematică, variabilele și operatorii indică certitudine Ele exprimă nu numere, ci adevăr (adevărat) sau fals (fals) De exemplu, validitatea expresiei "Dacă apa din piscină este caldă, atunci voi înota" se bazează pe validitatea a două lucruri care pot fi convertite în variabile booleene A și B: R: Apa din piscină este caldă B: Înot Ele sunt fie adevărate (adevărate), fie false (false) A=Adevărat înseamnă apă caldă de piscină, B=Fals înseamnă că nu înot Variabila B nu poate fi adevărată pe jumătate, deoarece sunt doar parțial incapabil să înot Dependența dintre variabile este indicată de operatorul condițional simbol A->B exprimă ideea că A-True implică B=True: A -> B : dacă apa din piscină este caldă, atunci voi înota Alți operatori pot exprima alte idei Pentru a nega o idee, utilizați semnul !, operatorul de negație !L este opusul lui A: R: Apa din piscină este rece B: Eu nu înot În logica fuzzy, valorile pot fi intermediare, dar nu vor fi luate în considerare în această carte Capitolul Bazele Având în vedere A -> B și nu înot, cum rămâne cu apa din piscină? Apa caldă presupune înot, pentru că dacă nu este acolo, apa din piscină nu poate fi caldă Fiecare expresie condiționată are un echivalent opus: Pentru oricare două variabile A și B A -> B este identic ! -> !L Un alt exemplu este dacă nu știi să scrii un cod bun, atunci nu ai citit această carte Opusul acestei judecăți este următorul: dacă ați citit această carte, atunci știți să scrieți un cod bun Ambele propoziții spun același lucru, dar în moduri diferite Rețineți că "Dacă apa din piscină este caldă, voi înota" nu înseamnă "voi înota doar în apă caldă" Această afirmație nu spune nimic despre piscinele reci Cu alte cuvinte, A -> B nu înseamnă B -> A Pentru a exprima ambele condiționale, folosiți condiționalul bidirecțional - A B : Voi înota dacă și numai dacă apa din piscină este caldă Aici, apa caldă din piscină echivalează cu faptul că voi înota: a ști despre apa din piscină înseamnă a ști că voi înota și invers Din nou, ferește-te de eroarea inversă: nu presupune niciodată că B -> A decurge din A -> B Acești operatori logici sunt cei mai cunoscuți deoarece sunt adesea scrisi explicit în codul sursă - AND (AND), R (OR) și XOR (OR exclusiv) AND returnează True dacă toate ideile sunt adevărate; R returnează True dacă orice idee este adevărată; XOR returnează True dacă ideile se exclud reciproc Imaginați-vă o petrecere în care se servesc vodcă și vin: Și, apropo, ambele sunt adevărate Logice A: Ai băut vin * Î: Ai băut vodcă A R B: Ai băut A ȘI B: Le-ai băut pe amândouă V A XOR B: Ai băut fără să amesteci Verificați dacă înțelegeți corect cum funcționează acești operatori În tabel listează toate combinațiile posibile a două variabile Rețineți că A -> B este identic cu !L R B și A XOR B este identic cu !(L B) A în !A A >B A<>B A șiB A sau B AxorB EY EY EJ □ □ □ □ □ □ ER EY EY □ □ □ Operații booleene pentru patru posibile combinatii A si B Algebra booleană vă permite să simplificați expresiile logice în același mod în care algebra elementară le simplifică pe cele numerice Pentru secvențele care constau doar din operații AND sau R, parantezele nu au sens La fel ca și secvențele de numai operații de adunare sau înmulțire din algebra elementară, aceste operații pot fi evaluate în orice ordine Numit după George Boole ( - ) Publicațiile sale a trăit începutul logicii matematice Capitolul Bazele A ȘI (B ȘI C) = (L ȘI B) ȘI C; A R (B R C) \u d (L R B) SAU C În algebra elementară deschidem parantezele: a * (b + c) = (a * b) + (a * c) În mod similar, în logică, efectuarea unei operații AND după R este echivalentă cu efectuarea unei operații R pe rezultatele operațiilor AND și invers: A ȘI (B R C) = (L ȘI B) R (L ȘI C); A R (B ȘI C) \u d (L R B) ȘI (L SAU C) Nu există vară și iarnă în același timp, așa că fie nu avem vară, fie nu avem iarnă Pe de altă parte, ambele expresii "nu vară" și "nu iarnă" sunt adevărate dacă (și numai) nu avem cazul când fie vară, fie iarnă Conform acestei logici, operațiile AND pot fi reduse la operații R și invers: !(D ANDB) !L R ! ÎN; \A AND \B = !(D ORB) Aceste reguli vă permit să transformați modele logice, să le dezvăluiți proprietățile și să simplificați expresiile Să rezolvăm problema eșuează din cauza supraîncălzirii wa când aerul condiționat este oprit El, de asemenea eșuează din cauza supraîncălzirii dacă răcitorul funcționează defectuos La Care sunt condițiile serverului? Modelând această sarcină în variabile logice, este posibil să se formuleze într-o singură expresie condițiile când serverul eșuează: Augustus de Morgan era prieten cu George Bull În plus, a predat-o pe tânăra Ada Lovelace, care a devenit prima programatoare cu un secol înainte de crearea primului computer Logice R: Serverul se supraîncălzi Î: Aerul condiționat este oprit C: Răcitorul nu funcționează D: Serverul este oprit (L ȘI ) R (L ȘI C) D Folosind regula distributivității, punem în paranteză A: A ȘI (B R C) -> D Serverul rulează când \D Contrastul este scris astfel: \D-> !(L AND ( R C)) Să aplicăm regula lui de Morgan și să deschidem parantezele: \D > !L SAU !(B SAU C) Să folosim din nou regula lui de Morgan: \D > !R SAU(!BANDA !C) Aceasta expresie ne spune ca atunci cand serverul ruleaza, avem fie !L (nu se supraincalzeste), fie !B SI !C (totul este in regula cu aerul conditionat si cooler) O altă modalitate de a analiza modelele logice este verificarea datelor cu toate combinațiile posibile ale variabilelor sale Fiecare variabilă din tabelul de adevăr are propria sa coloană Rândurile reprezintă combinații de stări variabile Vz V Vi v vi VI □□ □□ □ □ □ V V Vg Ui □ □ □□□ □ □ □ □ □ □ □ □ □ □ □ □□ □□ □□ □ □□□ □□□ □□□□ □ □ □ EZ □ □ □ □ □ □ □ □□ □ □□ □ □ □ □ □ □□ □ □ □□ □□□ □ □□□ □□ □□□□ □□ □ □□ □ □□ □□ □□□ □□□ □ □□□□ □□□□□□ Tabele cu toate combinațiile posibile de la una la cinci variabile booleene Capitolul Bazele Logici O variabilă necesită două șiruri de caractere: unul este adevărat, celălalt este fals Pentru a adăuga o variabilă, trebuie să dublați numărul de linii Noua variabilă este setată la True în liniile originale și False în cele adăugate (Fig ) Dimensiunea tabelului de adevăr se dublează cu fiecare adăugare a unei variabile, deci este rezonabil să se folosească un astfel de tabel numai în cazurile în care există puține variabile Să vedem cum poate fi folosit un tabel de adevăr pentru a analiza o problemă Să presupunem că trebuie să creăm un sistem de management al bazei de date cu următoarele cerințe tehnice: ) dacă baza de date este blocată, atunci putem salva datele; ) baza de date nu trebuie să se blocheze când coada de cereri de scriere este plină; ) fie coada de cereri de scriere este plină, fie memoria cache este plină; ) dacă memoria cache este plină, atunci baza de date nu poate fi blocată Este posibil? În ce condiții ar funcționa un astfel de sistem? În primul rând, transformăm fiecare cerință tehnică într-o expresie logică Un astfel de sistem de management al bazelor de date poate fi modelat folosind patru variabile R: Baza de date este blocată Î: Este posibil să salvați date C: coada de cereri de scriere este plină D: Cache plină ]- A^B ?■ !(D ȘI C) : CORD : ^ !D De exemplu, un tabel de adevăr pentru de variabile ar avea peste un miliard de rânduri ( Capitolul Bazele În continuare, vom crea un tabel de adevăr cu toate combinațiile posibile de variabile (Tabelul ) Au fost adăugate coloane suplimentare pentru a verifica conformitatea cu specificațiile Tabel de adevăr pentru a testa patru expresii Condiția # A b c D Toate cele patru □ □ O □ □ despre □ □ o □ d □ □ d □ □ O □ O □ □ □ □ □ □ o o □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ o Toate cerințele tehnice sunt îndeplinite în stările până la și până la În aceste state /! = False, ceea ce înseamnă că baza de date nu poate fi niciodată blocată Rețineți că memoria cache este goală numai în stările și Pentru a testa ceea ce ai învățat, încearcă să rezolvi ghicitoarea "Cine ține zebra?" Aceasta este o problemă logică binecunoscută, în mod eronat A se vedea http://code energy/zebra-puzzle Logice atribuit lui Albert Einstein Se spune că doar % dintre oameni o pot rezolva, dar mă îndoiesc foarte mult Folosind o tabelă de adevăr mare și simplificând și combinând în mod corespunzător afirmațiile logice, o vei rezolva, sunt sigur de asta Ori de câte ori aveți de-a face cu situații care permit una dintre cele două opțiuni, amintiți-vă că acestea pot fi modelate folosind variabile booleene Datorită acestui lucru, este foarte ușor să obțineți expresii, să le simplificați și să trageți concluzii Acum să ne uităm la cea mai impresionantă aplicație a logicii: proiectarea computerelor electronice Grupurile de variabile booleene pot reprezenta numere în formă binară Operațiile logice în cazul numerelor binare pot fi combinate pentru calcule Porțile logice efectuează operații logice pe curent electric Sunt utilizate în circuitele electrice care efectuează calcule la viteze foarte mari O poartă logică primește valori prin pinii de intrare, efectuează lucrări și trimite rezultatul printr-un pin de ieșire Există porți logice AND, SAU, XOR etc Valorile adevărate și false sunt reprezentate de semnale electrice de înaltă și, respectiv, joasă tensiune Expresiile logice complexe pot fi calculate în acest fel aproape instantaneu De exemplu, circuitul electric din fig însumează două numere Să vedem cum funcționează această schemă Nu fi leneș, urmărește progresul operațiunilor pentru a înțelege cum funcționează magia (Fig ) Adevărat=l, Fals = O Dacă nu știți de ce este în binar, aruncați o privire la Anexa I Capitolul Bazele Schema de însumare a numerelor din două cifre transmise de perechi de variabile logice ( , , și B, B ) într-un număr de trei cifre (S ^ Sg) Calcul + = (în binar este + = ) Pentru a profita de acest mod rapid de calcul, convertim problemele numerice în formă binară (logică) Tabelele de adevăr ajută la modelarea și testarea circuitelor Și algebra booleană este despre simplificarea expresiilor și, prin urmare, a circuitelor La un moment dat, porțile logice au fost realizate folosind relee electrice mari, ineficiente și scumpe Când tranzistoarele au înlocuit releele, a devenit posibilă producția în masă de porți logice Oamenii au găsit din ce în ce mai multe noi Combinatorică pentru a face tranzistorii mai mici Principiile de funcționare ale unității centrale de procesare (CPU) moderne sunt încă construite pe algebră booleană Un procesor modern este pur și simplu un circuit care constă din milioane de pini microscopici și porți logice care controlează fluxul electric de informații Este important să poți număra lucrurile corect, deoarece în cazul problemelor de calcul va trebui să faci asta de multe ori Matematica va fi chiar mai dificilă decât înainte, dar nu vă alarmați Unii oameni cred că nu poate deveni un programator bun doar pentru că crede că este un matematician prost Dacă vrei să știi, personal mi-am picat examenul de matematică de la școală și totuși am devenit ceea ce îmi doream La școală, ei nu predau genul de matematică care îi face pe oameni buni programatori Nimeni nu vrea să înghesuie formule și proceduri pas cu pas dacă a trecut deja examenele finale Dacă o astfel de informație este brusc necesară, este ușor de găsit pe Internet Calculele nu trebuie făcute manual pe hârtie De la programator este necesară în primul rând intuiția Cunoștințele în combinatorică și capacitatea de a rezolva probleme combinatorii dezvoltă această intuiție Deci, să lucrăm cu mai multe instrumente în ordine: înmulțiri, permutări, combinații și sume Dacă un eveniment se întâmplă în n moduri diferite și un alt eveniment se întâmplă în m moduri diferite, atunci numărul de moduri diferite în care se pot întâmpla ambele evenimente este n × m Iată câteva exemple În , a fost creat un tranzistor operațional cu o dimensiune de nm Pentru referință: un atom de aur are o dimensiune de , nm Combinatoria și logica aparțin uneia dintre cele mai importante domenii ale informaticii, care se numește matematică discretă Capitolul Bazele T Să presupunem că codul PIN este format din două cifre și o literă latină Este nevoie în medie de o secundă pentru a introduce codul o dată Care este timpul maxim necesar pentru a ghici codul PIN corect? Două numere pot fi formate în de moduri ( - ), o literă în de moduri (A-Z) Prin urmare, există x - PIN-uri în total În cel mai rău caz, pentru a-l găsi pe cel potrivit, va trebui să le încercăm pe toate După de secunde (adică după de minute), cu siguranță îl vom sparge Să presupunem că de persoane doresc să se alăture echipei tale Pentru fiecare candidat, arunci o monedă și accepți doar dacă iese din cap Câte posibile compoziții de echipă pot fi? Înainte de începerea recrutării, există o singură opțiune pentru componență - tu însuți În plus, fiecare aruncare a unei monede dublează numărul de opțiuni posibile Acest lucru trebuie făcut de de ori, așa că trebuie să calculați care este puterea lui : x x " = = opțiuni de comandă de de ori Vă rugăm să rețineți că una dintre atâtea opțiuni este atunci când sunteți singurul membru al echipei Dacă avem n elemente, atunci le putem ordona în n\ moduri diferite Factorialul unui număr are un caracter exploziv, chiar și cu valori mici ale lui n dă numere uriașe În cazul în care nu sunteți familiarizat cu el: n\ \u d n x (n - ) x (n - ) x x Combinatorică Este ușor de observat că n\ este numărul total de moduri în care n elemente pot fi ordonate În câte moduri poți alege primul element din n? După ce este ales, în câte moduri poate fi ales al doilea? Câte opțiuni au mai rămas pentru a treia? Gândiți-vă puțin la asta, apoi treceți la exemplele Compania ta de transport livrează în orașe Vrei să știi în ce ordine este mai bine să ocoliți aceste orașe pentru a reduce consumul de combustibil Dacă este nevoie de o microsecundă pentru a calcula lungimea unui traseu, cât timp va dura pentru a calcula lungimea tuturor rutelor posibile? Orice permutare a orașe oferă o nouă rută Factorialul este numărul de combinații diferite, deci sunt în total! = x x x , trilioane de trasee Numărul de microsecunde necesar pentru a le calcula este aproximativ echivalent cu zile Dacă nu ai avea , ci de orașe, ai avea nevoie de de mii de ani JȚl/ O fată învață o scară de note Ea vrea să arăți toate melodiile posibile care folosesc note Fiecare notă trebuie să apară o dată pe melodie și fiecare astfel de melodie trebuie să sune timp de o secundă Care este durata sunetului? Trebuie să numărăm numărul de combinații de note din Pentru a exclude notele neutilizate, trebuie să încetăm să mai calculăm factorial după al șaselea factor Formal, acesta este numărul de combinații posibile m de n elemente posibile În cazul nostru, obținem: Prin definiție ! = Spunem că elementele zero, adică mulțimea goală, pot fi ordonate într-un mod unic Capitolul Bazele ! x x x x x x ( - )! ! = x x x x x multiplicatori - de melodii Va dura de ore pentru a le asculta pe toate, așa că ar fi bine să convingi fata să găsească melodia perfectă într-un alt mod Factorialul n\ oferă un număr umflat de moduri de a ordona n elemente dacă unele dintre ele sunt aceleași Combinațiile suplimentare, în care astfel de elemente apar pur și simplu în alte poziții, nu trebuie luate în considerare Dacă r elemente dintr-o succesiune de n sunt identice, există r\ moduri de a le reordona Adică n\ include r\ astfel de combinații Împărțiți n\ la acest surplus pentru a obține numărul de combinații unice De exemplu, numărul de combinații diferite Literele E din CODE ENERGIE sunt egale cu - Un biolog studiază un segment de ADN asociat cu o boală genetică Acesta constă din de perechi de baze, unde ar trebui să fie A-T, iar ar trebui să fie GC Omul de știință vrea să ruleze simularea pe toate segmentele de ADN posibile unde există atât de multe perechi de baze Câte sarcini are de îndeplinit? Mai întâi, să calculăm toate combinațiile posibile ale acestor de perechi de baze Apoi, pentru a lua în considerare perechile de baze repetate A-T și G-C, împărțim rezultatul la ! si la ! si ia: Combinatorică = opțiuni ( !x !) R Dar sarcina nu este încă rezolvată Trebuie luată în considerare orientarea perechilor de nucleotide Următoarele două exemple nu sunt identice: Pentru fiecare secvență de bp, există de combinații de orientare diferite Prin urmare, numărul total de combinații este: x " trilioane Și asta doar pentru o secvență mică de doar de perechi de baze în care cunoaștem distribuția! Cel mai mic ADN reproductibil cunoscut astăzi este cel al micului circovirus porcin și are de perechi de baze Codul ADN și viața în general sunt cu adevărat uimitoare din punct de vedere tehnologic Este doar o nebunie: ADN-ul uman are aproximativ miliarde de perechi de baze duplicate în fiecare dintre cele trilioane de celule din organism Imaginați-vă un pachet de cărți de joc doar F În câte moduri puteți împărți șase cărți adversarului ! nimeni? Am văzut deja că - este numărul de permutări Capitolul Bazele cărți din Deoarece ordinea lor nu contează, trebuie să împărțiți acest număr la ! ! - combinații ( - )! kimiinatii- Binomul Q) este numărul de moduri în care puteți extrage m elemente dintr-o serie de n elemente, indiferent de ordinea acestora: t\(p-t)\ Construcția din partea stângă (notație binomială) se citește ca "de la n la ti" Ai o tablă de șah goală și dame care pot fi plasate oriunde pe tablă În câte moduri diferite pot fi plasate figurile? Tabla de șah este împărțită în de pătrate, > Când rezultatul unuia evenimentele nu afectează rezultatul altuia, ele sunt numite independente Probabilitatea de a obține o combinație de rezultate specifice a două evenimente independente este egală cu produsul probabilităților fiecăruia dintre ele Trebuie să organizați stocarea datelor timp de un an Un disc are o probabilitate de per defecțiune Capitolul Bazele miliard Altul costă % din prețul primului, dar în acest caz, probabilitatea de eșec este de în Ce unitate ar trebui să cumpărați? Dacă alegeți să utilizați trei unități ieftine, veți pierde date numai dacă toate trei eșuează Probabilitatea ca aceasta Risc de pierdere a datelor -Р se dovedește a fi mult mai mic decât în cazul unui disc scump și veți plăti doar % din costul acestuia se întâmplă egal O aruncare de zar nu poate produce un și un număr impar în același timp Probabilitatea de a obține fie , fie un număr impar este, prin urmare, egală cu - A-|- = - Când două evenimente nu pot avea loc în același timp - dar, ele sunt incompatibile sau se exclud reciproc Dacă trebuie să calculați probabilitatea oricăruia dintre mai multe evenimente disjunctive, pur și simplu însumați probabilitățile lor individuale Serviciul dvs de internet oferă trei planuri: gratuit, de bază și profesional Știți că un vizitator ocazional va alege un plan gratuit cu șanse de %, unul de bază cu șanse de % și unul profesionist cu șanse de % Care sunt șansele ca o persoană să se aboneze la un plan plătit? Evenimentele enumerate sunt incompatibile: nu puteți selecta atât tarifele de bază, cât și cele profesionale în același timp Probabilitatea ca un utilizator să se aboneze la un plan plătit este de , + , = , Numărul de puncte aruncate pe zar nu poate fi atât multiplu de trei ( , ) cât și nu poate fi divizibil cu trei, dar va aparține cu siguranță uneia dintre aceste categorii de numere Probabilitate Probabilitate i pentru a obține un rezultat care este un multiplu de trei este g - , prin urmare, probabilitatea de a obține un număr care nu este divizibil cu trei este egală cu , i = - Când două evenimente incompatibile acoperă toate opțiunile posibile, ele sunt numite complementare sau subordonate Suma probabilităților evenimentelor complementare este de % Castelul tău este protejat de cinci turnuri Fiecare are % șanse de a lovi invadatorul înainte ca acesta să ajungă la poartă Care sunt șansele să-l oprești? Șansa de a lovi un inamic este , + , + , + , + , = , sau %, nu? Gresit! Nu însumați niciodată probabilitățile unor evenimente independente, nu faceți o greșeală comună În schimb, utilizați evenimente complementare de două ori, după cum urmează % șansă de a lovi un inamic - complementar % șanse de a rata Probabilitatea ca toate turnurile să nu lovească este de , " , Evenimentul "toate turnurile ratate" este complementar evenimentului "cel puțin un turn lovit" Deci probabilitatea de a opri inamicul este - , = , Dacă ai aruncat o monedă de ori și ai obținut capete, a crescut asta șansa ca a -a aruncare să capete capete? Sau o combinație de șase numere consecutive de la la ar fi mai puțin probabil să câștige la loterie decât orice altă combinație? Nu fiți victima "eșecului gamerului"! Ceea ce sa întâmplat deja nu afectează rezultatul evenimentului independent În nici un caz Nimeni Capitolul Bazele Da Într-o loterie cu adevărat aleatorie, probabilitatea ca un anumit număr să apară este exact aceeași ca oricare altul Nu există un model conform căruia numerele care au căzut rar în trecut ar trebui să cadă mai des în viitor S-ar putea continua să vorbim despre probabilitate, dar domeniul de aplicare al secțiunii nu permite acest lucru Întotdeauna în căutarea unor instrumente suplimentare atunci când rezolvați probleme complexe Iată un exemplu de persoane vor să se alăture echipei tale Pentru fiecare, arunci o monedă și accepți doar dacă iese din cap Care sunt șansele să luați șapte persoane sau mai puțin? Da, e greu de calculat Dacă cauți mult timp pe internet, vei ajunge în cele din urmă la distribuția binomială Îl puteți vizualiza în Wolfram Alpha tastând: B( , / ) fresh top item pește "- mare remove top item altfel pește "- proaspăt remove top item rezultat adăugați (pește) returnează rezultatul Repetare Combinând două liste sortate într-o a treia, de asemenea sortată Parcurge toate numele peștilor din listele de intrare, efectuând un număr fix de operații pentru fiecare element Prin urmare, algoritmul de îmbinare are complexitatea O(u) În capitolul anterior, am văzut cum funcția selection sort folosește o buclă imbricată în alta Acum vom învăța cum să folosim o buclă imbricată pentru a calcula un set de putere Având în vedere o colecție de obiecte S, atunci mulțimea de puteri este mulțimea care conține toate submulțimile lui Mărimea datelor de intrare (așa-numita dimensiune de intrare) este numărul de elemente din ambele liste de intrare luate împreună Bucla while efectuează trei operații pentru fiecare dintre aceste elemente, deci T(u) = Zn Dacă doriți să aflați mai multe despre seturi, consultați Anexa III Capitolul Strategie • În parfumerie, parfumurile florale sunt realizate prin combinarea aromelor diferitelor flori Având în vedere un set de flori F, cum numărați toate aromele care pot fi făcute din ele? Orice aromă constă dintr-un subset de F, astfel încât setul său de putere conține toate aromele posibile Acest set de putere este calculat iterativ Pentru setul zero de culori, există o singură opțiune - fără miros În cazul în care luăm o altă floare, duplicăm aromele deja disponibile și le adăugăm (Fig ) Acest proces poate fi descris folosind cicluri În bucla exterioară, decidem ce floare vom lua în considerare în continuare Bucla interioară dublează parfumurile și adaugă o nouă floare acestor copii funcția power set(flori) parfumuri "- Set new fragrances add(Set new) pentru fiecare floare din flori new fragrances "- copie (parfumuri) pentru fiecare parfum în new fragrances fragrance add(flower) fragrances "- parfumuri + new fragrances return parfumuri Adăugarea fiecărei flori noi are ca rezultat dublarea numărului de parfumuri din setul de parfumuri, indicând o creștere exponențială ( I + = x A) Algoritmii care dublează numărul de operații dacă cantitatea de date de intrare crește cu un element sunt exponențiali, complexitatea lor în timp este ( ") Generarea de seturi de putere este echivalentă cu generarea tabelelor de adevăr (vezi secțiunea Logica din Capitolul ) Dacă desemnăm fiecare floare ca o variabilă booleană, atunci orice parfum poate fi ușor reprezentat ca valori Adevărat/Fals ale acestor variabile În tabelul de adevăr, fiecare rând va fi o posibilă formulă de aromă Enumerarea iterativă a tuturor parfumurilor folosind patru flori Repetare Capitolul Strategie Vorbim despre recursivitate atunci când o funcție delegă munca clonelor sale Un algoritm recursiv îți vine în mod natural în minte atunci când trebuie să rezolvi o problemă formulată în termenii ei înșiși De exemplu, luăm binecunoscuta șiruri Fibonacci Începe cu două, iar fiecare număr următor este suma celor două anterioare: , , , , , , , Cum se creează o funcție care returnează al n-lea număr Fibonacci (Fig ) ? Calcul recursiv al celui de-al șaselea număr Fibonacci fib(n) dacă n cea mai bună valoare cea mai bună valoare "- valoarea vânzărilor(candidatul) cel mai bun candidat "-candidatul returnează cel mai bun candidat Pentru n articole, există n selecții Pentru fiecare, verificăm dacă greutatea sa totală depășește capacitatea rucsacului și dacă costul total al colecției este mai mare decât cel mai bun pe care l-am găsit până acum Cu alte cuvinte, se efectuează un număr constant de operații pentru fiecare selecție, ceea ce înseamnă că algoritmul are complexitatea ( ") În intervalul de n zile există "(n + )/ perechi de zile (vezi secțiunea Combinatorică din Capitolul ) Consultați Anexa III pentru mai multe detalii despre seturile de putere Căutare (forță brută) cu întoarcere Cu toate acestea, nu fiecare colecție de articole ar trebui verificată Multe dintre ele lasă rucsacul pe jumătate gol, ceea ce indică faptul că există opțiuni mai bune În continuare, vom învăța strategii care pot ajuta la optimizarea căutării unei soluții prin respingerea efectivă a opțiunilor nepotrivite Joci șah? Piesele se deplasează pe tablă > Funcția merge sort este apelată de patru ori, de fiecare dată pentru - elemente: x - = (u) eu/ Funcția merge sort este apelată de ori fiecare și dyi pentru o listă de - elemente: x xO - \u d r) x I X) Toți pașii de partiționare au aceeași complexitate (u) Complexitatea de timp a mergesort este deci x x (n), unde x este numărul de pași de partiționare necesari pentru a finaliza algoritmul Cum se calculează x? Știm că funcțiile recursive încetează să se mai apeleze imediat ce ajung la cazul lor de bază Cazul nostru de bază este o listă singleton De asemenea, am văzut că pasul de împărțire x funcționează pe liste de n elemente Deoarece: x P F -> x=n->x=log n Dacă nu sunteți familiarizat cu funcția log , nu vă sfiați! x = log w este doar un alt mod de a scrie x = n Programatorii iubesc creșterea logaritmică Nu putem ignora r pentru că nu este o constantă Dacă dimensiunea listei n se dublează, atunci avem nevoie de încă un pas de împărțire Dacă n este de patru ori, atunci vor fi necesari doi pași suplimentari de partiționare Z b Împărțiți și guvernați Vedeți cum numărul de pași de partiționare necesari crește încet pe măsură ce crește numărul total de elemente sortate (Tabelul ) Numărul de pași de împărțire necesari pentru liste de diferite dimensiuni Dimensiunea listei (l) od l Numărul necesar de pași de partiționare , , , , Complexitatea temporală a sortării de îmbinare este deci log w x O(n) = O(nlogn) Aceasta este o îmbunătățire uriașă față de sortarea de selecție O(u ) Amintiți-vă diferența de performanță dintre algoritmii liniar-logaritmici și pătratici pe care am văzut-o în capitolul anterior din Fig ? Chiar dacă presupunem că algoritmul O(u ) va fi procesat de un computer rapid, în final va fi tot mai lent decât algoritmul O(wlogw) pe o mașină slabă (Tabelul ) Vedeți singuri: scrieți algoritmi de sortare cu complexitate liniar-logaritmică și pătratică, apoi comparați performanța lor pe liste aleatorii de diferite dimensiuni Atunci când volumele de date de intrare sunt uriașe, astfel de îmbunătățiri sunt adesea necesare Orice proces care reduce treptat cantitatea de date de intrare cu fiecare pas, împărțindu-l la un divizor constant, face un număr logaritmic de pași până când intrarea este complet redusă Capitolul Strategie Și acum să separăm și să stăpânim sarcinile pentru care am folosit căutarea exhaustivă mai devreme Pentru intrări mari, algoritmii O(nlogn) rulează mult mai repede decât algoritmii (n ) care rulează pe computere de de ori mai rapid Volum de date Quadratic Loglinear (număr de țări din lume) ms s (număr de aeroporturi din lume) minute minute (număr de cuvinte în dicționarul englez) ore minute milion (număr de hawaieni) zile și ore milioane (număr de rezidenți din Florida) ani și zile de milioane (număr de cărți publicate vreodată) de ani de zile , miliarde (număr de pagini pe Internet) de ani ani Pentru problema celei mai bune oferte (vezi Brute Force $ ), abordarea Divide and Conquer este mai bună decât soluția frontală Împărțirea listei de prețuri în jumătate duce la două sarcini secundare: găsirea celei mai bune oferte în prima jumătate și cea mai bună ofertă în a doua După aceea, vom obține una dintre cele trei opțiuni: ) cea mai bună afacere cu cumpărarea și vânzarea în prima jumătate a anului; ) cea mai bună afacere cu cumpărarea și vânzarea în a doua jumătate; ) cea mai bună afacere cu cumpărarea în prima jumătate și vânzarea în a doua Z b Împărțiți și guvernați Demonstrarea executării funcției de comerț Dreptunghiurile arată apelurile individuale de tranzacționare cu intrări și ieșiri Capitolul Strategie Primele două cazuri sunt soluții de subproblemă Al treilea este ușor de găsit: trebuie să găsiți cel mai mic preț în prima jumătate a listei și cel mai mare în a doua Dacă intrarea este de doar o zi, atunci singura opțiune este să cumpărați și să vindeți în ziua respectivă, rezultând profit zero function trade(preturi) dacă preţurile lungime = întoarce Ѳ fostul "- preţuri prima jumătate ultimul "- preţuri ultima jumătate case "- max (din urmă) - min (fost) return max (comerț (fost), tranzacționare (din urmă), caz ) Funcția de tranzacționare face o comparație banală, împarte lista în jumătate și găsește maximul și cel scăzut în jumătăți Găsirea maximului sau minimului într-o listă de n elemente necesită analizarea tuturor n elemente, deci un singur apel la tranzacționare costă O(n) Veți observa că arborele de apeluri recursiv comercial (Figura ) este foarte asemănător cu sortarea de îmbinare (Figura ) Are, de asemenea, pași de partiționare log zz, fiecare costând O(n) Prin urmare, funcția de comerț are și complexitatea O(nlogn), o îmbunătățire uriașă față de complexitatea O(n ) a abordării anterioare de căutare exhaustivă Problema rucsacului (vezi secțiunea Brute Force Brute Force) poate fi, de asemenea, împărțită și astfel rezolvată Dacă nu ați uitat, avem n articole din care să alegeți Vom nota proprietățile fiecăruia dintre ele după cum urmează: g(r), este greutatea z'-ro a obiectului; Pj este costul z'-ro al articolului Indicele articolului z poate fi orice număr între și n Venitul maxim pentru capacitate dintr-un rucsac cu n articole deja selectate Z b Împărțiți și guvernați setează K(n, c) Dacă se ia în considerare un element suplimentar i = n + , atunci acesta fie va crește, fie nu va crește venitul maxim posibil, care devine egal cu cea mai mare dintre cele două valori K (n, s) - dacă nu este selectat un articol suplimentar K(n, s - wn + l) + rl + - dacă este selectat un articol suplimentar Cazul presupune respingerea noului articol, cazul include includerea lui în set și plasarea lui între elementele selectate anterior, oferind suficient spațiu pentru el Aceasta înseamnă că putem defini o soluție pentru n itemi ca un maxim de soluții parțiale pentru n - itemi: K(n, s) = verifica (K(n - , s), K(n - l, c-wn) + pl) Știți deja suficient și ar trebui să convertiți cu ușurință această formulă recursivă într-un algoritm recursiv Figura ilustrează modul în care un proces recursiv rezolvă o problemă Opțiunile identice sunt evidențiate în diagramă - reprezintă subsarcini identice care sunt calculate de mai multe ori În continuare, vom învăța cum să prevenim astfel de recalculări și să îmbunătățim performanța Rezolvarea problemei rucsacului cu articole și o capacitate de rucsac de Articolele numerotate și cântăresc două unități, restul cântăresc o unitate Capitolul Strategie Când rezolvați o problemă, uneori este necesar să efectuați aceleași calcule în mod repetat Programarea dinamică vă permite să identificați subsarcinile recurente, astfel încât să puteți finaliza fiecare o singură dată Metoda general acceptată pentru a face acest lucru se bazează pe memorare și are un nume "vorbitor" Vă amintiți algoritmul de calcul al numerelor Fibonacci? Arborele recursiv al apelurilor (vezi Figura ) arată că fib( ) este evaluat de mai multe ori Putem remedia acest lucru prin stocarea rezultatelor pe măsură ce sunt calculate și numai prin apeluri noi către f ib pentru acele calcule ale căror rezultate nu sunt încă în memorie (Figura ) Această tehnică Arborele apelurilor recursive pentru dfib Dreptunghiurile verzi indică apelurile care nu sunt reîncercate În acest caz, se spune că sarcinile au subsarcini suprapuse Programare dinamică reutilizarea rezultatelor intermediare se numește memorare Îmbunătățește performanța funcției fib: M "- [ ■ => ; => ] funcția dfib(n) dacă n nu în M M[n] "- dfib(nl) + dfib(n- ) returnează M[n] Este clar că arborele apelurilor recursive pentru problema rucsacului (vezi Figura ) conține apeluri repetate multiple Aplicarea aceleiași tehnici pe care am folosit-o pentru funcția Fibonacci evită aceste apeluri repetate și, ca urmare, reduce cantitatea de calcule (Fig ) Rezolvarea recursiva a problemei rucsacului folosind memorarea Programarea dinamică face posibilă obținerea unor performanțe acceptabile din codul extrem de lent Capitolul Strategie Analizați-vă cu atenție algoritmii pentru a vă asigura că nu se recalculează După cum vom vedea mai târziu, uneori suprapunerea subsarcinilor poate cauza probleme Arborele recursiv pentru funcția de tranzacționare (vezi Figura ) nu are apeluri recursive și încă face recalcularea Se uită la intrare pentru a găsi valorile maxime și minime Intrarea este apoi împărțită în două părți, iar apelurile recursive o analizează din nou pentru a găsi maximul și minimul în fiecare jumătate Avem nevoie de un alt principiu pentru a evita aceste treceri repetate Până acum, am folosit o abordare de sus în jos în care cantitatea de intrare este redusă treptat până când sunt atinse cazurile de bază Dar putem merge și de jos în sus, mai întâi calculând cazurile de bază, apoi colectându-le din nou și din nou până când obținem rezultatul general Să rezolvăm problema celei mai bune oferte (vezi secțiunea Brute Force $) în acest fel Fie P(n) prețul din a-a zi, iar B(n) să fie cea mai bună zi pentru a cumpăra atunci când se vinde în a-a zi Dacă vindem în prima zi, atunci vom putea cumpăra abia atunci, nu există alte opțiuni, deci ( ) = Dar dacă vindem în a doua zi, ( ) poate fi egal cu sau : ( ) ( ) ! ( ) = (cumpărați în ziua , vindeți în ziua ) Trebuie să găsești cel mai înalt bărbat, cea mai înaltă femeie și cea mai înaltă persoană din cameră Veți măsura înălțimea tuturor celor prezenți pentru a găsi cea mai înaltă persoană și apoi veți face acest lucru din nou și din nou pentru femei și bărbați separat? Programare dinamică Ziua cu cel mai mic preț înainte de ziua , dar nu în ziua este ( ) Prin urmare, pentru ( ): ( ) ( ) = ( ) > preț pe zi ( ) -> ( ) = ( ) Rețineți că ziua cu cel mai mic preț înainte de ziua ar fi ( ) De fapt, pentru fiecare n, cel mai mic preț cu o zi înainte de ziua n - B(n - ) Putem folosi aceasta pentru a exprima B(n) în termeni de B(n - ): P B(n) = V(p-V) dacă Р(гі) cel mai bun profit sell day "- n cel mai bun profit "- profit returnare (zi vânzare, B[zi vânzare]) Algoritmul efectuează un număr fix de operații simple pentru fiecare element al listei de intrare, prin urmare, are complexitate O(n) Acesta este un salt uriaș de performanță peste complexitatea algoritmului O(nlogn) anterior și Capitolul Strategie este clar incomparabil cu complexitatea O(n ) a metodei de căutare exhaustivă Acest algoritm are, de asemenea, complexitate spațială O(n), deoarece vectorul auxiliar B conține același număr de elemente ca și datele de intrare În Anexa IV, veți învăța cum să economisiți memorie prin crearea unui algoritm cu complexitate spațială ( ) Multe probleme sunt legate de minimizarea sau maximizarea valorii țintă: găsirea celei mai scurte căi, obținerea celui mai mare profit etc Astfel de probleme se numesc probleme de optimizare Când soluția este o secvență de opțiuni, folosim adesea strategia de ramificare și legată Scopul său este să câștige timp prin descoperirea și eliminarea rapidă a opțiunilor proaste Pentru a înțelege cum sunt căutate, trebuie mai întâi să înțelegem conceptele de "limită superioară" și "limită inferioară" Limitele indică intervalul unei valori Limita superioară stabilește o limită pentru cât de mare poate fi Limita inferioară este cea mai mică valoare la care poți spera; garantează că orice valoare este fie egală, fie mai mare decât aceasta Uneori găsim cu ușurință soluții care sunt aproape de optime: o cale scurtă - dar poate nu cea mai scurtă; profit mare - dar poate nu maxim Ele dau limitele soluției optime De exemplu, orice rută scurtă de la un punct la altul nu va fi niciodată mai scurtă decât distanța dintre ele într-o linie dreaptă Prin urmare, distanța în linie dreaptă este limita inferioară a căii celei mai scurte Ramuri și margini În problema greedy knapsack (vezi algoritmi euristici ^ ), profitul obținut de greedy knapsack este o limită inferioară a profitului optim (se poate apropia sau nu de profitul optim) Acum imaginați-vă o versiune a problemei rucsacului în care avem materiale în vrac în loc de obiecte și putem umple rucsacul cu cât putem încăpea Această versiune a problemei este rezolvată într-un mod "lacom": continuați să turnați materialele cu cel mai mare raport cost-greutate: rucsac pulberat(articole, greutate max ) greutate bag - bag items "- List new itemi "- sort by value weight ratio(articole) pentru fiecare i din articole greutate "- min(greutate max - greutate bag, i greutate) bag weight "- bag weight + weight value "- weight * i value weight rao bagged value "- bagged value + valoare bag items append(articol, greutate) return bag items, bag value Adăugarea unei limite de indivizibilitate a articolului va scădea doar profitul maxim posibil, deoarece va trebui să schimbăm ultimul articol din rucsac pentru ceva mai ieftin Aceasta înseamnă că powdered knapsack oferă o limită superioară a profitului optim cu articole indivizibile Am văzut deja că găsirea profitului optim în problema rucsacului necesită calcule scumpe O(n ) Cu toate acestea, putem obține rapid limitele superioare și inferioare ale profitului optim folosind funcțiile powdered knapsack și greedy knapsack Să încercăm să facem acest lucru folosind exemplul problemei rucsacului (Tabelul ) Metoda de eliminare a constrângerilor din sarcini se numește slăbire El este adesea folosit pentru a calcula constrângeri în probleme de optimizare Capitolul Strategie Limitele superioare și inferioare în problema rucsacului Element Cost Greutate Raport cost/greutate Max capacitate A La De la D , E F , ± Imaginea din dreapta ilustrează situația înainte de a începe să umpleți rucsacul Primul câmp conține articole neambalate pe care trebuie să le luăm în considerare Al doilea câmp reprezintă spațiul liber din rucsac și articolele care sunt deja setate Executarea funcției greedy knapsack oferă un profit de , în timp ce powdered knapsack oferă un profit de , Aceasta înseamnă că profitul optim este undeva la mijloc După cum știm din secțiunea Divide and Conquer, această problemă cu n obiecte este împărțită în două subprobleme cu n - obiecte Prima subsarcină implică faptul că elementul A a fost luat, a doua că nu a fost luat: Calculăm limitele superioare și inferioare pentru aceste două subprobleme Fiecare are o limită inferioară de : acum știm asta Ramuri și margini soluția optimă este între și Să ne uităm la subproblema din dreapta pentru că are limite mai interesante: Subproblema din stânga are cea mai promițătoare limită superioară Să continuăm analiza și să defalcăm această subsarcină: Capitolul Strategie Acum putem trage concluzii importante Subsarcina evidențiată are o limită inferioară de , care este egală cu limita sa superioară Aceasta înseamnă că profitul optim aici trebuie să fie exact De asemenea, rețineți că este mai mare decât limitele superioare în toate celelalte ramuri care au fost analizate Nicio altă sucursală nu va oferi mai mult profit decât , ceea ce înseamnă că le putem exclude pe toate de la căutări ulterioare Utilizarea rațională a limitelor superioare și inferioare ne-a permis să găsim profitul optim cu foarte puține calcule Ne-am adaptat dinamic spațiul de căutare pe măsură ce oportunitățile sunt explorate Iată principiile generale ale metodei ramurilor și legate: ) împărțiți sarcina în subsarcini; ) găsiți limitele superioare și inferioare ale fiecărei sarcini secundare; ) comparați limitele subsarcinilor tuturor ramurilor; ) alegeți sarcina cea mai promițătoare și reveniți la pasul Dacă vă amintiți, strategia de backtracking (consultați secțiunea relevantă) vă permite, de asemenea, să găsiți o soluție fără a examina toate opțiunile posibile În cazul retrocedării, eliminăm căi, explorăm fiecare cale pe cât posibil și ne oprim atunci când suntem mulțumiți de soluție În cazul metodei ramificații și legate, determinăm în prealabil căile nepromițătoare și nu irosim energie la examinarea lor Rezolvarea problemelor, în esență, este deplasarea prin spațiul posibilităților pentru a găsi opțiunea potrivită Am învățat mai multe moduri de a face acest lucru Cea mai simplă este căutarea exhaustivă, adică verificarea secvențială a fiecărui element din spațiul de căutare Materiale utile Am învățat să împărțim sistematic sarcinile în altele mai mici, obținând o creștere mare a productivității Divizarea multiplă a sarcinilor este adesea asociată cu rezolvarea problemelor cauzate de aceleași subsarcini În aceste cazuri, este important să folosiți programarea dinamică pentru a evita recalculările Am văzut că backtracking poate optimiza unii algoritmi pe baza unei căutări exhaustive Valorile limitelor superioare și inferioare (unde pot fi obținute) vă permit să accelerați căutarea unei soluții, pentru aceasta se utilizează metoda ramurilor și legate Și când costul calculării soluției optime este inacceptabil, ar trebui utilizat un algoritm euristic Toate strategiile pe care le-am văzut sunt concepute pentru a funcționa cu date În continuare, vom afla cele mai comune modalități de organizare a datelor în memoria computerului și modul în care acestea afectează performanța operațiunilor Kleinberg J , TradosE Algoritmi: dezvoltare și aplicare Sankt Petersburg: Peter, Alegerea unei strategii de proiectare a algoritmului (Choosing Algorithm Design Strategy, Shailendra Nigam, cm https://code energy/nigam) Programare dinamică (Programare dinamică, de Umesh V Vazirani, vezi https://code energy/vazirani) Programatorii buni se îngrijorează de structurile de date și de relațiile lor Linus Torvalds Controlul asupra datelor în informatică este de o importanță fundamentală: procesele de calcul constau în operații asupra datelor care transformă intrarea în ieșire Dar algoritmii de obicei nu specifică modul în care sunt executați De exemplu, algoritmul de îmbinare (vezi secțiunea "Iterație" din Capitolul ) se bazează pe codul sursă extern dezinstalat care creează liste de numere, verifică elementele și adaugă acele elemente la liste Algoritmul de regine (secțiunea "Căutare (brută) cu backtracking") face același lucru: nu îi pasă cum se efectuează operațiunile pe tabla de șah sau cum sunt stocate pozițiile în memorie Aceste detalii sunt ascunse în spatele așa-numitelor abstracții În capitolul vom învăța: cum tipurile de date abstracte fac codul curat; * ce abstracții generale este de dorit să le cunoaștem și să le poți folosi; care sunt modalitățile de structurare a datelor in minte Date Dar înainte de a aborda acest subiect, să înțelegem ce înseamnă termenii "abstracție" și "tip de date" Abstracțiile ne permit să omitem detalii; oferă o interfață simplă pentru a accesa funcționalitatea obiectelor complexe De exemplu, o mașină ascunde un mecanism complex în spatele panoului de control și în așa fel încât oricine poate învăța cu ușurință să conducă fără a fi nevoit să înțeleagă ingineria mecanică În software, abstracțiile procedurale ascund complexitatea implementării procesului din spatele apelurilor de procedură În algoritmul de tranzacționare (a se vedea secțiunea "Divide and Conquer" din Capitolul ), procedurile min și max ascund mecanica de a găsi numerele minime și maxime și, prin urmare, simplifică algoritmul Folosind abstracții, puteți crea module care vă permit să efectuați operații complexe apelând o singură procedură, ca aceasta: html "- fetch source ("https://code energy") Cu o singură linie de cod, am primit pagina site-ului, în ciuda faptului că operațiunile interne pentru această sarcină sunt extrem de complexe va fi punctul central al capitolului Ele ascund detaliile proceselor de prelucrare a datelor Dar înainte de a înțelege cum funcționează abstractizarea, trebuie să ne perfecționăm înțelegerea tipurilor de date Un modul, sau o bibliotecă, este o piesă de software structurală care oferă proceduri de calcul universale Ele pot fi incluse după cum este necesar în alte părți ale software-ului Ele implică rezolvarea unui nume de domeniu, crearea unei prize de rețea, stabilirea unei conexiuni SS L criptate și multe altele Capitolul Date Facem diferența între diferite tipuri de elemente de fixare (cum ar fi șuruburi, piulițe și cuie) în funcție de operațiunile pe care le putem efectua asupra acestora (cum ar fi folosirea unei șurubelnițe, cheie sau ciocan) În mod similar, distingem diferite tipuri de date în funcție de operațiunile care pot fi efectuate asupra acestora De exemplu, o variabilă care conține o secvență de caractere care poate fi convertită în majuscule sau litere mici și care permite adăugarea de noi caractere este de tip String Șirurile reprezintă date text O variabilă care poate fi inversată și care permite operații XOR, R și AND este de tip boolean Astfel de valori booleene iau una dintre cele două valori: Adevărat sau Fals Variabilele care pot fi adăugate, împărțite și scăzute sunt de tip Număr (numeric) Fiecare tip de date este asociat cu un anumit set de proceduri Procedurile care sunt concepute pentru a funcționa cu variabile care stochează liste sunt diferite de procedurile care sunt concepute pentru a funcționa cu variabile care stochează seturi, care, la rândul lor, sunt diferite de procedurile care sunt concepute pentru a lucra cu numere este o descriere detaliată a unui grup de operațiuni aplicabile unui anumit tip de date Ei definesc o interfață pentru lucrul cu variabile care conțin date de un anumit tip și ascund toate detaliile de stocare și gestionare a datelor în memorie Când algoritmii noștri trebuie să opereze pe date, nu includem comenzi de citire și scriere în memoria computerului Folosim module externe de prelucrare a datelor care furnizează procedurile definite în ADT Tipuri de date abstracte De exemplu, pentru a lucra cu variabile care stochează liste, avem nevoie de: proceduri de creare și ștergere a listelor; proceduri de accesare și ștergere a i-lea element al listei; procedura de adăugare a unui nou element la listă Definițiile acestor proceduri (numele lor și ceea ce fac) sunt conținute în Lista ADT Putem lucra cu liste folosind doar aceste proceduri Deci nu gestionăm niciodată memoria computerului în mod direct ADT face codul nostru mai ușor de înțeles și schimbat Omițând detaliile în procedurile de prelucrare a datelor, vă puteți concentra pe cel mai important lucru - procesul algoritmic de rezolvare a problemei Există diferite moduri de structurare a datelor în memorie și, ca urmare, module diferite pentru procesarea aceluiași tip de date Trebuie să o alegem pe cea care se potrivește cel mai bine situației actuale Modulele care implementează același ADT oferă aceleași proceduri Aceasta înseamnă că putem schimba modul în care stocăm datele și efectuăm operațiuni pur și simplu prin aplicarea unui modul diferit de procesare a datelor E ca și cu mașinile: toate mașinile electrice și pe gaz au aceeași interfață Dacă poți conduce o mașină, poți conduce orice alta Folosim aceleași module în proiecte în care sunt procesate date de același tip De exemplu, procedurile power set și recursive power set din capitolul anterior operează pe variabile care reprezintă mulțimi, Set Aceasta înseamnă că putem folosi același modul Set în ambii algoritmi De regulă, trebuie să operam cu mai multe tipuri de date: numere, text, coordonate geografice, imagini etc Pentru a ne organiza mai bine Capitolul Date program, creăm module separate, fiecare dintre ele conținând cod care funcționează exclusiv cu un anumit tip de date Aceasta se numește "separarea funcționalității", părțile codului care se ocupă de același aspect logic ar trebui grupate în modul propriu, separat Când sunt amestecate cu ceva străin, acesta se numește cod ofuscat Luăm un modul de procesare a datelor scris de altcineva, îl înțelegem folosind procedurile definite în ADT-ul său și imediat după aceea le putem folosi pentru a opera pe noi tipuri de date Nu trebuie să înțelegem cum funcționează acest modul Dacă utilizați un modul de procesare a datelor, atunci nu vor exista erori de procesare a datelor în codul programului dumneavoastră Dacă găsiți o eroare într-un modul de procesare a datelor, repararea acesteia o dată va remedia imediat toate părțile codului dvs care au fost afectate de acesta Pentru a rezolva o problemă de calcul, este extrem de important să cunoașteți tipul de date care sunt prelucrate și operațiunile pe care trebuie să le efectuați cu aceste date Este mai puțin important să decideți ce ADT veți folosi În continuare, vom introduce tipuri de date abstracte bine-cunoscute de care ar trebui să fii conștient Se găsesc în mulți algoritmi Vin chiar la pachet cu multe limbaje de programare Tipurile de date primitive sunt tipuri de date care sunt acceptate nativ în limbajul de programare pe care îl utilizați Pentru Abstracții generale Nu aveți nevoie de module externe pentru a lucra cu ele Aceasta include numere întregi, numere în virgulă mobilă și operații universale cu acestea (adunare, scădere, împărțire) Majoritatea limbilor acceptă, de asemenea, stocarea textului, a valorilor booleene și a altor date simple în variabilele lor în mod implicit Imaginați-vă un teanc de hârtie Puteți pune o altă foaie pe ea sau o puteți lua pe cea de sus Foaia care a fost adăugată prima la teanc va fi întotdeauna ultima foaie scoasă din teanc O stivă reprezintă o astfel de stivă și vă permite să lucrați numai cu elementul său superior Elementul din partea de sus a stivei este întotdeauna elementul care a fost adăugat ultimul O implementare a stivei trebuie să ofere cel puțin două operațiuni: push(e) - adăugați elementul e în partea de sus a stivei; pop() - obține și elimina un element din partea de sus a stivei Stivele mai avansate pot suporta operațiuni suplimentare: verificarea dacă stiva conține elemente sau obținerea numărului curent al acestora Această prelucrare a datelor este cunoscută ca (Last-In, First-Out, "last in, first out"); putem elimina doar elementul de sus, care a fost adăugat ultimul Stiva este un tip de date important și se găsește în mulți algoritmi Pentru a implementa caracteristica Anulare introducere într-un editor de text, fiecare modificare pe care o faceți este împinsă în stivă Dacă doriți să o anulați, editorul de text scoate editarea din stivă și revine la starea anterioară Numerele cu virgulă mobilă sunt o modalitate obișnuită de a reprezenta numerele care au un separator zecimal În țările vorbitoare de limbă engleză, un punct este folosit ca separator zecimal, în majoritatea celorlalte țări este o virgulă - Notă pe Capitolul Date Pentru a implementa backtracking (vezi secțiunea aferentă din capitolul ) fără recursivitate, trebuie să stocați pe stivă secvența de alegeri care v-au condus la punctul curent Când examinăm un nou nod, împingem o referință la acesta în stivă Pentru a reveni cu un pas, pur și simplu scoatem (pop()) ultimul element din stivă, obținând în același timp o referință la starea anterioară O coadă este exact opusul unei stive De asemenea, vă permite să salvați și să preluați date, dar elementele sunt preluate întotdeauna de la începutul cozii - cel care a stat în coadă de cel mai mult timp Sună înfricoșător? De fapt, aceasta este aceeași cu șirul real de oameni care stau la distribuția din cantină! Iată operațiunile de bază cu cozi: enqueue(e) - adaugă elementul e la sfârșitul cozii; dequeue() - Eliminați un element din partea din față a cozii Coada funcționează conform principiului organizării datelor (First-In, FirstOut, "first in, first out"), deoarece primul element introdus în coadă este întotdeauna primul care îl părăsește Cozile sunt folosite în multe scenarii de calcul Dacă implementați un serviciu de livrare de pizza online, atunci cel mai probabil veți ține comenzile la coadă Ca experiment de gândire, luați în considerare ce s-ar întâmpla dacă pizzeria dvs ar servi comenzi folosind o stivă în loc de o coadă O coadă cu prioritate este similară cu o coadă obișnuită, singura diferență fiind că elementele plasate în ea au prioritate Oamenii care așteaptă îngrijiri într-un spital este un exemplu real de coadă prioritară de urgență Abstracții generale cazurile au cea mai mare prioritate și merg direct în partea din față a cozii, în timp ce cele minore sunt adăugate la sfârșitul cozii Principalele operațiuni implementate de coada de prioritate sunt următoarele: enqueue (e? p) - adaugă elementul e la coadă în funcție de nivelul de prioritate p; dequeue() - Returnează elementul din capul cozii și îl elimină Un computer are de obicei multe procese de lucru și doar unul sau câteva procesoare dedicate rulării acestora Sistemul de operare pune toate procesele care așteaptă să fie executate într-o coadă prioritară Fiecare proces are propriul nivel de prioritate Sistemul de operare scoate din coadă procesul și îl lasă să ruleze pentru o perioadă Ulterior, dacă procesul nu s-a încheiat, acesta este din nou pus în coadă Sistemul de operare repetă această procedură iar și iar Unele procese sunt mai importante și primesc imediat timp CPU, altele așteaptă mai mult în coadă Procesul care primește intrare de la tastatură primește de obicei cea mai mare prioritate - pentru că dacă computerul nu răspunde la apăsările de taste, atunci utilizatorul poate crede că este înghețat și încearcă să facă o repornire "la rece", ceea ce este întotdeauna dăunător Când lucrați cu grupuri de elemente, uneori este necesară flexibilitate De exemplu, este posibil să doriți să reordonați articolele sau să le extrageți, să le inserați și să le ștergeți în ordine aleatorie În aceste cazuri, este convenabil să folosiți o listă (listă) Cel mai adesea ADT "List" acceptă următoarele operațiuni: insert(n, e) - introduce elementul e la pozitia n; remove(n) - scoate elementul din pozitia n; Capitolul Date get(n) - obține elementul în poziția n; sort() - sortare elemente; slice(start, end) - returnează o porțiune a listei începând de la începutul poziției și se termină la finalul poziției; reverse() - inversează ordinea elementelor Lista este unul dintre cele mai utilizate ADT-uri De exemplu, dacă trebuie să stocați legături către fișiere accesate frecvent în sistemul dvs , atunci o listă este ideală: puteți sorta legăturile pentru afișare și le puteți elimina dacă fișierele asociate devin accesate mai rar Stiva și coada ar trebui să fie preferate atunci când flexibilitatea oferită de listă nu este necesară Utilizarea unui ADT mai simplu asigură că datele sunt procesate într-o manieră strictă și previzibilă (fie FIFO sau LIFO) De asemenea, face codul mai clar: știind că o variabilă este o stivă, este mai ușor de înțeles natura fluxurilor de date de intrare și de ieșire O listă sortată este utilă atunci când doriți ca elementele să fie în ordine constantă În aceste cazuri, în loc să găsim poziția corectă înainte de fiecare inserare în listă (și să o sortăm manual periodic), folosim o listă sortată Orice ar fi pus în el, elementele vor fi întotdeauna în ordine Niciuna dintre operațiunile acestui ADT nu vă permite să reordonați elementele sale O listă sortată acceptă mai puține operațiuni decât una normală: insert(e) - introduceți elementul e într-o poziție determinată automat în listă; Abstracții generale delete(n) - șterge elementul din poziția n; get(n): obțineți elementul din poziția n Un dicționar (hartă) este folosit pentru a stoca corespondențele dintre două obiecte: cheia cheie și valoarea valorii Puteți căuta pe o cheie și puteți obține valoarea asociată acesteia Un dicționar este potrivit, de exemplu, pentru a stoca ID-uri de utilizator ca chei și numele complete ca valori Un astfel de dicționar, având un număr de identificare, va returna numele asociat cu acesta Există următoarele operații pentru dicționare: set(key, value) - adaugă un element cu cheia și valoarea dată; delete(key) - șterge cheia și valoarea asociată acesteia; get(key) - Obține valoarea asociată cheii O mulțime reprezintă grupuri neordonate de elemente unice, similare cu mulțimile matematice descrise în Anexa III Acest ADT este utilizat atunci când ordinea elementelor nu este importantă sau când este necesar să se asigure unicitatea elementelor dintr-un grup Setul standard de operații pentru un set include: add(e) - adaugă un element la set sau returnează o eroare dacă elementul este deja în set; list() - listează toate elementele prezente în set; delete(e) - elimina un element din set Un ADT este pentru un programator, așa cum un tablou de bord este pentru un șofer Dar să încercăm totuși să înțelegem cum sunt așezate firele în spatele acestui tablou de bord Capitolul Date Un tip de date abstract descrie doar ce acțiuni pot fi efectuate asupra variabilelor de un anumit tip Acesta definește o listă de operațiuni, dar nu explică modul în care sunt efectuate Structurile de date sunt invers: ele descriu cum sunt organizate datele și cum pot fi accesate în memoria computerului Structurile de date asigură implementarea ADT în modulele de procesare a datelor Există multe moduri diferite de a implementa un ADT, deoarece există atât de multe structuri de date diferite Alegerea unei implementări ADT care utilizează structura de date care se potrivește cel mai bine nevoilor dvs este esențială pentru a crea programe de calculator eficiente În continuare, ne vom uita la cele mai comune structuri de date și vom afla despre punctele forte și punctele slabe ale acestora O matrice (argau) este cea mai simplă modalitate de a stoca un set de elemente în memoria computerului Constă în alocarea unui singur spațiu în memorie și scrierea secvențială a elementelor tale în el Sfârșitul secvenței este marcat cu un marker NULL special (Fig ) Conținutul memoriei A B C D NUL ° II II II II I II II II I Adresele celulelor de memorie Matrice în memoria computerului structurilor Fiecare obiect din matrice ocupă aceeași cantitate de memorie ca oricare altul Imaginează-ți o matrice care începe de la adresa unei locații de memorie s, unde fiecare element ocupă b octeți Pentru a obține elementul w, obțineți b octeți începând cu poziția de memorie s + (b x n) Acest lucru vă permite să accesați direct orice element al matricei O matrice este cea mai utilă pentru implementarea unei stive, dar poate fi folosită și pentru liste și cozi Array-urile sunt ușor de programat și au avantajul de a permite accesul instantaneu la orice element Dar au și dezavantaje Este posibil să nu fie practic să alocați blocuri mari de memorie contigue Dacă trebuie să creșteți o matrice, atunci este posibil să nu existe suficient spațiu în memorie adiacentă Eliminarea unui element din mijlocul unui tablou vine cu anumite probleme: trebuie să mutați toate elementele ulterioare cu o poziție la început sau să marcați spațiul de memorie al elementului eliminat ca liber Niciuna dintre aceste opțiuni nu este de dorit În mod similar, inserarea unui element într-o matrice vă va forța să mutați toate elementele ulterioare cu o poziție spre sfârșit O listă legată vă permite să stocați elemente într-un lanț de celule care nu trebuie să fie în adrese de memorie consecutive Memoria pentru celule este alocată după cum este necesar Fiecare celulă are un indicator care indică adresa următoarei din lanț O celulă cu un indicator nul (NULL) marchează sfârșitul lanțului (Fig ) Listele legate sunt folosite pentru a implementa stive, liste și cozi Nu există probleme la creșterea unei liste legate: orice celulă poate fi stocată în orice parte a memoriei Astfel, dimensiunea listei este limitată doar de cantitatea de Capitolul Date memorie libera De asemenea, este ușor să inserați elemente în mijlocul listei sau să le eliminați - trebuie doar să schimbați pointerii celulei (Fig ) C A DESPRE? ÎN eu CU EU NUL D I I ~ ~~ I eu eu Lista legată în memoria computerului I Г~Оi I I | A ÎN Memorie libera NUL I Г~Оi I I |G^b~~|| | D Adăugarea unui element între B și C Eliminarea C O listă legată are și dezavantajele ei: nu putem obține imediat elementul i Mai întâi trebuie să citiți prima celulă, să extrageți adresa celei de-a doua celule din ea, apoi să citiți a doua celulă, structurilor extrageți din el un pointer către următoarea celulă și așa mai departe, până ajungem la i-a celulă În plus, atunci când adresa unei singure celule este cunoscută, nu este atât de ușor să o ștergeți sau să treceți înapoi în listă Fără alte informații, este imposibil să aflați adresa celulei anterioare din lanț O listă dublu legată este o listă legată în care celulele au doi indicatori: unul către celula anterioară, celălalt către următoarea (Fig ) listă dublu legată în memoria computerului Are același avantaj ca o listă legată: nu necesită alocarea în prealabil a unui bloc mare de memorie, deoarece spațiul pentru celule noi poate fi alocat după cum este necesar În același timp, indicatori suplimentari vă permit să vă deplasați înainte și înapoi de-a lungul lanțului de celule În acest caz, dacă adresa unei singure celule este cunoscută, o putem șterge rapid Și totuși încă nu avem acces direct la elementul i-lea De asemenea, menținerea a doi pointeri pe celulă necesită un cod mai complex și mai multă memorie Capitolul Date Limbajele de programare bogate includ de obicei implementări încorporate de listă, coadă, stivă și alte ADT-uri Aceste implementări se bazează adesea pe o structură de date standard Unele dintre ele pot chiar trece automat de la o structură de date la alta în timpul execuției programului, în funcție de modul în care sunt accesate datele Când performanța nu este o problemă, ne putem baza pe aceste implementări ADT generice și nu ne putem îngrijora de structurile de date Dar atunci când performanța trebuie să fie optimă sau când aveți de-a face cu un limbaj de nivel scăzut care nu are aceste caracteristici încorporate, rămâne la latitudinea dvs să decideți ce structuri de date să utilizați Analizați operațiunile prin care veți procesa informațiile și alegeți o implementare cu structura de date adecvată Listele legate sunt preferate în detrimentul matricelor atunci când: operațiunile de inserare și ștergere trebuie să fie extrem de rapide; nu este necesar acces aleatoriu la date; trebuie să introduceți sau să eliminați elemente între alte elemente; numărul de elemente nu este cunoscut dinainte (va crește sau va scădea pe măsură ce programul rulează) Matricele sunt preferate în detrimentul listelor legate atunci când: au nevoie de acces aleatoriu la date; au nevoie de acces foarte rapid la elemente; numărul de elemente nu se modifică în timpul execuției programului, ceea ce face ușoară alocarea spațiului contiguu memorie structurilor La fel ca o listă legată, un arbore folosește elemente care nu trebuie să fie învecinate în memoria fizică pentru a stoca obiecte Celulele de aici au și pointeri către alte celule, totuși, spre deosebire de listele legate, ele nu sunt aranjate liniar, ci într-o structură ramificată Arborii sunt folositori în special pentru datele ierarhice, cum ar fi directoarele de fișiere sau un lanț de comandă (Figura ) În terminologia arborescentă, o celulă se numește nod, iar un indicator de la o celulă la alta se numește margine Prima celulă este nodul rădăcină, este singura fără părinte Toate celelalte noduri din arbori trebuie să aibă exact un părinte Două noduri cu un părinte comun sunt numite noduri frați Părintele unui nod, bunicul, străbunicul (și așa mai departe până la nodul rădăcină) sunt strămoșii În mod similar, nodurile copil, nepoții, strănepoții (și așa mai departe până la fundul copacului) sunt numiți descendenți Nodurile care nu au noduri copil sunt frunze (prin analogie cu frunzele unui arbore real, calea dintre două noduri este determinată de un set de noduri și margini Nivelul unui nod este lungimea căii de la acesta la nodul rădăcină, înălțimea arborelui este nivelul celui mai adânc nod din arbore (Fig ) Și, în sfârșit, mulți copaci se numesc pădure Dacă un nod încalcă această regulă, mulți algoritmi de căutare în arbore nu vor funcționa Arborele de origine al limbilor indo-europene Capitolul Date Frunzele acestui copac reprezintă limbile moderne structurilor Capitolul Date Un arbore de căutare binar este un tip special de arbore care este căutat în mod deosebit de eficient Nodurile dintr-un arbore de căutare binar pot avea cel mult două noduri copil În plus, nodurile sunt aranjate în funcție de valoarea/cheia lor Nodurile copil din stânga părintelui ar trebui să fie mai mici decât acesta, iar la dreapta - mai mult (Fig ) Dacă un arbore respectă această proprietate, este ușor să găsești un nod cu o anumită cheie/valoare în el: funcția find node(binary tree, value) node "- binary tree nodul rădăcină whie nod dacă nod valoare = valoare nodul de întoarcere dacă valoare > valoarea nodului nod" - nod dreapta eise nod" - nod stânga returnează "NU GĂSIT" Pentru a insera un element, găsim ultimul nod, urmând regulile de construire a unui arbore de căutare și conectăm un nou nod la acesta în dreapta sau în stânga: structurilor funcția insert node(binary tree, new node) nod "- binary tree root node while node last node - nod dacă nou nod valoare > nod valoare nod" - nod dreapta altfel nod" - nod stânga if new node value > last node value last node right "- new node altfel ultimul nod stânga" - nod nou Dacă este inserat într-un arbore de căutare binar prea multe noduri, ajungi cu un arbore foarte înalt, unde majoritatea nodurilor au un singur nod copil De exemplu, dacă inserați secvențial noduri cu chei/valori care sunt întotdeauna mai mari decât cele anterioare, ajungeți cu ceva care arată ca o listă legată Cu toate acestea, putem rearanja nodurile din arbore astfel încât înălțimea acestuia să fie redusă Această procedură se numește echilibrarea arborilor Un copac perfect echilibrat are o înălțime minimă (Figura ) Același arbore de căutare binar cu o echilibrare diferită: prost echilibrat, mediu și perfect Capitolul Date Majoritatea operațiunilor de arbore necesită parcurgerea nodurilor prin referință până când este găsit un anumit nod Cu cât înălțimea arborelui este mai mare, cu atât calea medie dintre noduri este mai lungă și cu atât mai des trebuie să accesați memorie Prin urmare, este important să reduceți înălțimea copacilor Un arbore de căutare binar perfect echilibrat poate fi creat dintr-o listă sortată de noduri, astfel: funcția build balanced(noduri) dacă nodurile sunt goale returnează NULL mijloc "- noduri lungime/ stânga "- noduri felie( , mijloc - ) dreapta "- noduri felie(mijloc + , noduri lungime) echilibrat "- BinaryTree new(root=nodes[middle]) echilibrat stânga "- build balanced(stânga) echilibrat dreapta "- build balanced(dreapta) returnează echilibrat Luați în considerare un arbore de căutare binar cu n noduri și o înălțime maximă posibilă de n În acest caz, este similar cu o listă legată Înălțimea minimă a unui arbore perfect echilibrat este log n Dificultatea de a găsi un element în arbore este proporțională cu înălțimea acestuia În cel mai rău caz, pentru a găsi elementul, trebuie să cobori la cel mai de jos nivel al frunzelor O căutare într-un arbore echilibrat cu n elemente este deci O(logw) Acesta este motivul pentru care această structură de date este adesea aleasă pentru a implementa seturi (unde se presupune că trebuie să verifice prezența elementelor) și dicționare (unde este necesar să se caute perechi cheie-valoare) Cu toate acestea, echilibrarea arborilor este costisitoare, deoarece necesită sortarea tuturor nodurilor Dacă echilibrați după fiecare inserare sau ștergere, operațiunile vor deveni mult mai lente De obicei, copacii sunt supuși acestei proceduri după mai multe inserări și ștergeri Dar echilibrarea de la caz la caz este o strategie rezonabilă numai pentru copacii care se schimbă rar Pentru a gestiona eficient arborii binari care se schimbă frecvent, au fost inventați arbori binari echilibrați structurilor (arborele binar de auto-echilibrare) Procedurile de inserare sau îndepărtare a acestora asigură că arborele rămâne echilibrat Un arbore roșu-negru este un exemplu binecunoscut de arbore echilibrat care colorează nodurile în roșu sau negru în funcție de strategia de echilibrare Arborii negru roșu sunt adesea folosiți pentru a implementa dicționare: un dicționar poate fi editat intens, dar anumite chei din el vor fi încă găsite rapid datorită echilibrării Un arbore AVL este o altă subspecie de arbori echilibrați Este nevoie de puțin mai mult pentru a introduce și îndepărta elementele decât un copac roșu-negru, dar este în general mai bine echilibrat Aceasta înseamnă că vă permite să obțineți elemente mai rapid decât arborele roșu-negru Arborii AVL sunt adesea folosiți pentru a optimiza performanța în scenarii care sunt foarte intens citite Datele sunt adesea stocate pe discuri magnetice care le citesc în blocuri mari În aceste cazuri, se utilizează un arbore B binar generalizat În astfel de arbori, nodurile pot stoca mai mult de un element și pot avea mai mult de două noduri copii, ceea ce le permite să opereze eficient asupra datelor în blocuri mari După cum vom vedea în scurt timp, arborii B sunt utilizați în mod obișnuit în sistemele de gestionare a bazelor de date Un heap binar este un tip special de arbore binar de căutare în care puteți găsi instantaneu cel mai mic (sau cel mai mare Aceștia sunt uneori denumiți arbori binari cu auto-echilibrare sau arbori binari cu auto-echilibrare - Accept pe Strategiile de auto-echilibrare nu fac obiectul acestei cărți Dacă ești curios, există videoclipuri online care arată cum funcționează acești algoritmi Capitolul Date mare) element Această structură de date este utilă în special pentru implementarea cozilor prioritare Operația de obținere a elementului minim (sau maxim) are complexitatea ( ) deoarece este întotdeauna nodul rădăcină al arborelui Găsirea și inserarea nodurilor costă încă O(logw) aici Mulțile urmează aceleași reguli de plasare a nodurilor ca și arborii binari de căutare, cu o limitare: un nod părinte trebuie să fie mai mare decât (sau mai mic decât) ambilor săi copii (Figura ) x S Y S z Nodurile organizate ca un heap binar cu max-heap (sus) și un heap binar min-heap (jos) Un heap binar min-heap este caracterizat prin faptul că valoarea la oricare dintre vârfurile sale nu este mai mare decât valorile descendenților săi; într-un heap binar max-heap, dimpotrivă, valoarea la orice nod nu este mai mică decât valorile descendenților săi - Accept pe structurilor Faceți referire la heap-ul binar ori de câte ori intenționați să vă ocupați frecvent de elementul maxim (sau minim) al setului Un grafic este similar cu un arbore Diferența este că nu are noduri copil sau părinte (vertice) și, prin urmare, niciun nod rădăcină Datele sunt organizate vag în noduri (vertice) și arce (margini), astfel încât orice nod poate avea un număr arbitrar de margini de intrare și de ieșire Este cea mai flexibilă dintre toate structurile și este folosită pentru a reprezenta aproape toate tipurile de date De exemplu, graficele sunt ideale pentru o rețea socială în care nodurile sunt oameni și marginile sunt prietenii Un tabel hash este o structură de date care vă permite să găsiți elemente dincolo de ( ) Căutarea durează constant, indiferent dacă căutați între milioane de articole sau doar La fel ca o matrice, un hash pentru stocarea datelor necesită mai întâi alocarea unui bloc mare de memorie secvențială Dar, spre deosebire de o matrice, elementele sale nu sunt stocate într-o secvență ordonată Poziția ocupată de un element este dată "magic" de o funcție hash Aceasta este o funcție specială care preia intrare pentru a stoca și returnează un număr aparent aleatoriu Este interpretată ca poziția în memorie în care va fi plasat elementul Acest lucru ne permite să obținem elemente imediat Valoarea dată este trecută mai întâi printr-o funcție hash Oferă poziția exactă în care ar trebui să fie elementul în memorie Dacă elementul a fost salvat, atunci îl veți găsi în această poziție Capitolul Date Cu toate acestea, există probleme cu tabelele hash: uneori, o funcție hash returnează aceeași poziție pentru diferite intrări Această situație se numește o coliziune hash Când apare, toate astfel de elemente trebuie să fie stocate în aceeași poziție în memorie (această problemă este rezolvată, de exemplu, prin utilizarea unei liste legate care începe la o anumită adresă) Coliziunile hash implică timp CPU și supraîncărcare de memorie, așa că cel mai bine este să le evitați O funcție hash bună ar trebui să returneze valori diferite pentru diferite intrări Prin urmare, cu cât este mai mare gama de valori pe care o funcție hash le poate returna, cu atât mai multe poziții de date vor fi disponibile și cu atât mai puțin probabil să apară o coliziune hash Prin urmare, trebuie să vă asigurați că cel puțin % din spațiul din tabelul hash rămâne nealocat În caz contrar, coliziunile vor începe să aibă loc prea des și performanța tabelului hash va scădea semnificativ Tabelele hash sunt adesea folosite pentru a implementa dicționare și seturi Acestea permit inserările și ștergerile să fie efectuate mai rapid decât structurile de date bazate pe arbore Pe de altă parte, tabelele hash necesită alocarea unui bloc foarte mare de memorie contiguă pentru a funcționa corect Am aflat că structurile de date definesc modalități specifice de organizare a elementelor în memoria computerului Structurile de date diferite necesită operații diferite pentru stocarea, ștergerea, preluarea și parcurgerea datelor stocate Nu există niciun glonț magic: de fiecare dată trebuie să alegi ce structură de date să folosești în funcție de situația actuală De asemenea, am învățat că este mai bine să ne ocupăm de ADT-uri în loc de structuri de date Ei eliberează codul de detaliile asociate cu prelucrarea datelor, Materiale utile și vă permit să comutați cu ușurință de la o structură la alta fără nicio modificare a codului Nu reinventați roata încercând să creați structuri de date de bază și tipuri de date abstracte de la zero (cu excepția cazului în care o faceți pentru distracție, învățare sau cercetare) Utilizați biblioteci de prelucrare a datelor de la terțe părți testate în timp Majoritatea limbilor au suport încorporat pentru aceste structuri Echilibrarea unui arbore de căutare binar, Stoimen, vezi https://code energy/stoimen) Corneli Lectura despre tipurile de date abstracte și structurile de date, vezi https://code energy/cornell-adt Note IITKGP despre tipurile de date abstracte, consultați https://code energy/iitkgp Search Tree Implementation by "Interactive Python", cm https://code energy/python-tree) [Programarea este] o ocupație atractivă, nu numai pentru că are promisiuni economice și științifice, ci și pentru că poate deveni în multe feluri o experiență estetică, cum ar fi scrisul de poezie sau muzică Donald Knuth Omenirea caută soluții la probleme din ce în ce mai dificile În cele mai multe cazuri, trebuie să vă ocupați de sarcini pentru care mulți dezvoltatori au lucrat deja la analogi aproximativi Este probabil că au venit cu algoritmi eficienți care pot fi luați și utilizați Când rezolvați probleme, primul pas ar trebui să fie întotdeauna să căutați algoritmi existenți În acest capitol, vom explora algoritmi cunoscuți care: sortați liste foarte lungi eficient; găsiți rapid elementul dorit; Situația în care se găsește o problemă nouă, neexplorată este rară Când cercetătorii găsesc o nouă problemă, ei scriu o lucrare despre ea Triere (||) operați și gestionați grafice', ♦ utilizați cercetarea operațională pentru optimizarea proceselor Veți învăța să recunoașteți problemele cărora li se pot aplica soluții cunoscute Există multe tipuri diferite de sarcini: sortarea datelor, căutarea modelelor (imagini, modele), rutare etc Și multe tipuri de algoritmi sunt direct legate de domeniile cercetării științifice și practice: procesarea imaginilor, criptografia, inteligența artificială În această carte, nu le putem acoperi pe toate Cu toate acestea, vom afla cei mai importanți algoritmi cu care orice programator bun ar trebui să fie familiarizat Înainte de apariția computerelor, sortarea datelor era o problemă cunoscută, iar realizarea manuală lua o cantitate enormă de timp Când Compania Tabulating Machine (cunoscută mai târziu ca IBM) a automatizat operațiunile de sortare în anii , a permis ca recensământul din SUA să fie procesat cu câțiva ani mai rapid Există mulți algoritmi de sortare Cele mai simple au complexitate temporală O(u ) Sortarea selecției (vezi secțiunea Estimarea timpului din Capitolul ) este un astfel de algoritm Este ceea ce oamenii preferă să folosească pentru a sorta pachetul fizic de cărți Sortarea selecției aparține unui grup mare de algoritmi de cost pătratic De obicei, le folosim pentru a comanda seturi de date cu mai puțin de de articole Unul dintre algoritmii cunoscuți este sortarea prin inserție Arată performanțe foarte bune Iată o listă mai completă: https://code energy/algo-list Capitolul Algoritmi în sortarea seturilor de date deja aproape ordonate, chiar și a celor foarte mari: funcția insertion sort(list) pentru i "- listă lungime j "- i în timp ce j și list[jl] > list[j] list swap items(j, j- ) j elemente[i] feliat "- itemi slice(i+l, itemi lungime) eLse feliate "- articole felie( , i- ) returnează binary search(sliced, key) La fiecare pas, algoritmul binary search efectuează un număr constant de operații și renunță la jumătate din intrare Înseamnă asta că pentru n elemente, spațiul de căutare va dispărea în log ? trepte Deoarece la fiecare pas sunt efectuate un număr constant de operații, algoritmul are complexitatea O(logw) Puteți căuta prin milioane sau trilioane de articole și acest algoritm va funcționa în continuare bine Cu toate acestea, există algoritmi și mai eficienți Dacă elementele sunt stocate într-un tabel hash (vezi secțiunea "Structuri" din capitolul anterior), este suficient să calculați cheia hash a elementului căutat Acest hash va da adresa lui! Timpul necesar pentru a găsi un element nu se modifică pe măsură ce spațiul de căutare crește Nu contează dacă cauți printre milioane, miliarde sau trilioane de elemente, numărul de operații va rămâne constant, ceea ce înseamnă că procesul are o complexitate de timp de ( ), funcționează aproape instantaneu Știm deja că graficele sunt o structură de date flexibilă care utilizează vârfuri și margini pentru a stoca informații Graficele sunt utilizate pe scară largă pentru a reprezenta date precum rețelele sociale (puncturile sunt oameni, marginile sunt prietenii), rețelele de telefonie (puncturile sunt telefoane și stații, marginile sunt linii de comunicație) și multe altele Capitolul Algoritmi Cum să găsiți un nod într-un grafic? Dacă structura graficului nu oferă asistență de navigare, va trebui să vizitați fiecare vârf până îl găsiți pe cel potrivit Există două moduri de a face acest lucru: prin parcurgerea graficului în adâncime și în lățime (Fig ) Traversarea adâncimii graficului vs traversarea lățimii Efectuând o primă căutare în adâncime (DFS) într-un grafic, ne deplasăm de-a lungul marginilor, mergând din ce în ce mai adânc în grafic După ce am ajuns la un vârf fără muchii care să conducă la noi vârfuri, revenim la cel anterior și continuăm procesul Folosim stiva pentru a ne aminti calea pe care am parcurs graficul, punând acolo un vârf în timp ce este explorat și eliminând-o când trebuie să ne întoarcem Strategia de backtracking (vezi secțiunea aferentă din capitolul ) efectuează traversarea deciziei exact în același mod funcția DFS(start node, key) next nodes "- Stack new() seen nodes"- Set new() next nodes push(start node) seen nodes add(start node) Contează whiie nu next nodes nod gol "- next nodes pop() dacă node key = cheie returnează nodul pentru n în node connected nodes dacă nu n în seen nodes next nodes push(n) seen nodes add(n) return NULL Dacă parcurgerea în profunzime a graficului nu pare a fi o soluție acceptabilă, puteți încerca prima căutare pe lățime (BFS) În acest caz, graficul este străbătut de niveluri: în primul rând, vecinii vârfului inițial, apoi vecinii vecinilor acestuia etc Vârfurile care trebuie vizitate sunt stocate în coadă Când explorăm un vârf, punem în coadă vârfurile sale secundare, apoi determinăm următorul vârf de explorat, scoțându-l din coadă funcția BFS(start node, cheie) next nodes "- Coadă nou() seen nodes "- Set new() next nodes enqueue(start node) seen nodes add(start node) care nu următorii noduri empty nod" - next nodes scoate la coada() dacă nod cheie = cheie nodul de întoarcere pentru n în node connected nodes dacă nu n în seen nodes next nodes enqueue(n) seen nodes add(n) return NULL Vă rugăm să rețineți că algoritmii DFS și BFS diferă doar prin modul în care stochează următoarele vârfuri de examinat: într-un caz este o coadă, în celălalt este o stivă Deci ce abordare ar trebui să luăm? Algoritmul DFS este mai simplu de implementat și utilizează mai puțină memorie: spațiu de stocare suficient Capitolul Algoritmi Co-zx/uu>hz>-t-Pso, MlisklYag mhll"€ ѵѵ CAmXXjUXz C , y > (nu puteți cumpăra un număr negativ de dulapuri) Cum ai rezolva aceasta problema? Achiziționarea numărului maxim de dulapuri cu cel mai bun raport depozitare/spațiu nu este o decizie corectă deoarece există spațiu limitat pentru instalarea dulapurilor S-ar putea merge pe calea forței brute: scrieți un program care calculează pentru toate posibilele x și y și obțineți o pereche care oferă r optim Această soluție funcționează pentru probleme simple, dar nu funcționează cu un număr mare de variabile Se pare că problemele de optimizare liniară ca aceasta pot fi rezolvate fără programare Trebuie doar să folosești dreptul Capitolul Algoritmi Instrumentul potrivit pentru muncă: metoda simplex Se ocupă foarte eficient de problemele de optimizare liniară Metoda Simplex a ajutat industrii întregi să rezolve probleme complexe încă din anii Când vă confruntați cu o astfel de sarcină, nu reinventați roata, luați doar un solutor simplex gata făcut Rezolvatorii simplex necesită să specificați o funcție de maximizat (sau minimizați) și ecuații care modelează constrângeri Rezolvatorul se va ocupa de restul În această problemă, valoarea maximă a lui este atinsă la x = și r/ = Valorile lui x și y care satisfac constrângerile problemei Metoda simplex găsește valoarea optimă în spațiul soluțiilor acceptabile Pentru a înțelege mecanica funcționării sale, imaginați-vă toate valorile posibile ale lui x și y pe un plan bidimensional (Fig ) Constrângerile bugetare și de suprafață sunt reprezentate pe grafic prin linii Rețineți că spațiul tuturor soluțiilor posibile este o zonă închisă pe grafic S-a dovedit că soluția optimă pentru o problemă liniară ar trebui să fie punctul de colț al unei regiuni închise, cel în care liniile reprezentând limita Cercetare operațională niya Simplexul verifică punctele de colț și calculează care dintre ele optimizează Nu este ușor să vizualizați acest proces în probleme de optimizare liniară cu mai mult de două variabile, dar principiul matematic funcționează la fel peste tot Multe probleme de rețea și de curgere pot fi formulate în termeni de ecuații liniare și, prin urmare, rezolvate folosind metoda simplex De exemplu, în timpul Războiului Rece, armata SUA a calculat rutele de aprovizionare pe care Uniunea Sovietică le-ar putea folosi în Europa de Est (Figura ) Raport militar desecretizat din care arată capacitatea rețelei feroviare sovietice Capitolul Algoritmi jhȘ Rețeaua feroviară este reprezentată de linii care fac legătura între orașe Fiecare are debitul maxim - cel mai mare flux zilnic de mărfuri Cât de mult poate fi transportat dintr-un anumit oraș producator într-un anumit oraș consumator? Pentru a modela problema cu ecuații liniare, fiecărei căi ferate trebuie să i se atribuie o variabilă reprezentând cantitatea de marfă pe care o poate transporta Restricțiile sunt următoarele: nicio cale ferată nu poate transporta mai mult decât capacitatea sa; fluxul de bunuri de intrare ar trebui să fie echivalent cu cel de ieșire în toate localitățile, cu excepția orașelor producătoare și consumatoare Apoi, trebuie să alegeți astfel de valori pentru variabilele care vă vor permite să livrați încărcătura maximă orașului primitor Nu vom descrie în detaliu cum să afișați această sarcină într-o formă liniară Scopul nostru aici este doar de a transmite ideea că multe probleme de optimizare a graficelor, costurilor și fluxului pot fi rezolvate cu ușurință cu implementările existente ale metodei simplex Web-ul are toată documentația necesară Țineți ochii deschiși și nu reinventați roata Am arătat câțiva algoritmi și metode bine-cunoscute pentru rezolvarea unei game largi de probleme În primul rând, atunci când începeți să rezolvați o nouă problemă, încercați întotdeauna să găsiți un algoritm sau o metodă gata făcută Există un număr mare de algoritmi importanți pe care nu i-am putut include în acest capitol De exemplu, există algoritmi de căutare mai avansați decât cei ai lui Dijkstra (cum ar fi A* ), algoritmi care evaluează asemănarea a două cuvinte (editare distanță) Se citește ca [, , , ] DE LA UNDE ; Elementele de după SELECT sunt câmpurile care trebuie preluate Pentru a obține toate câmpurile dintr-un tabel, puteți scrie: SELECT * Pot exista mai multe tabele într-o bază de date, deci FROM specifică ce tabel interogați După comanda WHERE, setați criteriile de selectare a rândurilor Logica booleană poate fi folosită pentru a enumera mai multe condiții Următoarea interogare preia toate câmpurile din tabelul clienți, filtrând rândurile pe baza câmpurilor trecut ("nume") și vârstă ("vârstă"): SELECTAȚI * FROM clienți UNDE vârsta > ȘI nume = "Hohn"; Puteți trimite o interogare: SELECT * FROM clienți, fără clauză WHERE SGBD vă va oferi o listă cu toți clienții În plus, există și alți operatori de interogare de care ar trebui să știți: clauza ORDER BY sortează rezultatele după câmpul specificat (după În engleză, abrevierea SQL este mai des pronunțată ca "sequel", iar forma orală "es-q-al" nu este considerată incorectă model relațional lam), iar GROUP BY vă va ajuta să grupați și să obțineți rezultate agregate pentru grupuri De exemplu, dacă aveți un tabel de clienți cu câmpuri pentru țară și vârstă, puteți rula o interogare ca aceasta: SELECTAȚI țara, AVG(vârstă) DE LA clienți GRUPĂ PE ȚARA COMANDA PE tara; Va returna o listă sortată a țărilor în care locuiesc clienții dvs , împreună cu vârsta medie a clienților pentru fiecare țară SQL oferă și alte funcții agregate De exemplu, înlocuiți AVG(vârstă) cu MAX(vârstă) și veți obține vârsta celui mai vechi client din fiecare țară Uneori trebuie să examinați informațiile dintr-un șir și șirurile cu care este asociat Imaginează-ți că ai o masă cu comenzi și o masă cu clienți Tabelul de comenzi are o cheie străină pentru a se referi la clienți Pentru a găsi informații despre clienții care au plasat comenzi scumpe, va trebui să selectați datele din ambele tabele Dar nu trebuie să le interogați individual și să potriviți singur înregistrările Pentru a face acest lucru, SQL are o comandă specială: SELECTAȚI DISTINCT clienți nume, clienți telefon DE LA clienți DOIN comenzi ON orders customer = customers id UNDE comenzi suma > ; Această interogare va returna numele și numerele de telefon ale clienților care au plasat comenzi de peste USD Comanda SELECT DISTINCT forțează DBMS să returneze fiecare client o singură dată IN permite solicitări foarte flexibile , dar această flexibilitate are un preț Conexiunile sunt scumpe Baza de date va trebui să ia în considerare toate combinațiile de rânduri din tabelele pe care le alăturați Există mai multe moduri de a efectua o operație JOIN - vezi https://code energy/joins Capitolul Baze de date Mănânc o cerere Administratorul bazei de date trebuie să țină cont întotdeauna de produsul numărului de rânduri ale tabelelor care se unesc Pentru mesele foarte mari, îmbinările devin imposibile Operatorul IN este cel mai puternic instrument și în același timp principala slăbiciune a bazelor de date relaționale Pentru ca cheia primară a unui tabel să fie utilă, trebuie să puteți prelua rapid o înregistrare după ID Pentru a face acest lucru, DBMS construiește un index auxiliar care conține ID-uri de rând și adresele corespunzătoare în memorie (Fig ) În esență, un index este un arbore de căutare binar echilibrat (vezi secțiunea "Structuri" din capitolul anterior) Fiecare rând din tabel corespunde unui nod din arbore ID Nume Data nașterii Barbara Piskov / / Peter Naur Adi Shamir / / Ada Lovelace / / Bill Gates Alan Turing Dennis Ritchie Un index care afișează valorile ID și locația rândurilor corespunzătoare Cheile de nod sunt valorile din câmpul indexat Pentru a găsi o intrare cu o valoare dată, o căutăm în arbore După ce am găsit nodul, obținem adresa pe care o stochează și o folosim pentru a o prelua model relațional înregistrări Căutările în arbore binar sunt O(logw), așa că găsirea înregistrărilor în tabele mari este rapidă De obicei, SGBD creează un index pentru fiecare cheie primară din baza de date Dar dacă deseori trebuie să căutați înregistrări după alte câmpuri (de exemplu, căutați clienți după nume), puteți solicita SGBD să creeze indecși suplimentari pentru aceștia Indecșii sunt adesea creați automat pentru câmpurile care au o constrângere unică La inserarea unui nou rând, SGBD-ul trebuie să examineze întregul tabel pentru a se asigura că nu este încălcată nicio constrângere unică Dacă nu ar exista un index, o astfel de verificare ar însemna că trebuie să verificați toate rândurile din tabel Cu ajutorul unui index, putem efectua rapid o căutare și găsim, de exemplu, că valoarea pe care încercăm să o inserăm este deja prezentă Indexarea câmpurilor care au o constrângere unică este necesară pentru inserarea rapidă a elementelor Indexurile vă ajută să selectați rândurile în ordinea de sortare după câmpurile indexate De exemplu, dacă există un index pe câmpul pasche ("nume"), putem obține rândurile sortate după nume fără calcule suplimentare Dacă utilizați comanda ORDER BY pe un câmp fără index, SGBD-ul va trebui să sorteze datele în memorie înainte de a executa interogarea Multe SGBD-uri pot chiar refuza să execute o interogare care necesită sortare pe un câmp neindexat dacă sunt implicate prea multe rânduri Dacă trebuie să sortați rândurile mai întâi după țară și apoi după vârstă, a avea un index fie în câmpul de vârstă, fie în câmpul de țară nu vă va ajuta prea mult Indexul pe țară vă permite să selectați rânduri sortate după țară, dar apoi va trebui să sortați manual după vârstă pentru articolele care au aceeași țară Când sortarea pe două câmpuri este necesară, combinată sau concatenată, se folosesc indecși Ei indexează numeroase câmpuri și nu pot ajuta la căutarea articolelor Capitolul Baze de date mai rapid, dar ușurează obținerea datelor sortate după mai multe câmpuri Deci, indexurile sunt cool: vă permit să faceți interogări super-rapide și să accesați instantaneu datele sortate Atunci de ce nu avem indecși pentru toate câmpurile din fiecare tabel? Problema este că atunci când o înregistrare nouă este inserată sau ștearsă din tabel, toți indecșii trebuie actualizați pentru a reflecta modificarea Dacă există mulți indecși, atunci actualizarea, inserarea sau ștergerea rândurilor pot deveni operațiuni costisitoare din punct de vedere computațional (gândiți-vă la echilibrarea arborilor) În plus, indexurile ocupă spațiu limitat pe disc Trebuie să fiți conștienți de modul în care aplicația dvs utilizează baza de date RDBMS vine de obicei cu instrumente care vă ajută să faceți acest lucru Aceștia pot "explica" interogările spunând care indici au fost utilizați și câte rânduri trebuie scanate secvenţial pentru a finaliza interogarea Dacă interogările dvs pierd prea mult timp scanând secvențial datele dintr-un câmp, adăugați un index la acel câmp și vedeți dacă este util De exemplu, dacă căutați adesea în baza de date persoane de o anumită vârstă, atunci definirea unui index în câmpul de vârstă va permite DBMS să selecteze imediat rândurile care se potrivesc cu o anumită vârstă Veți economisi timp evitând scanările secvențiale ale bazei de date și apoi filtrați rândurile care nu se potrivesc cu vârsta necesară Dacă doriți să vă reglați baza de date pentru a-și îmbunătăți performanța, este extrem de important să știți ce indici să păstrați și pe care să renunțați Dacă baza de date este accesată în principal în modul de citire și este rar actualizată, ar putea avea sens să creați mai mulți indecși Indexarea greșită este principala cauză a încetinirilor sistemelor comerciale Administratorii de sistem neglijenți nu pun adesea la îndoială cum sunt executate interogările tipice - pur și simplu indexează câmpuri arbitrare despre care cred că vor îmbunătăți performanța Acest lucru nu trebuie făcut! Folosiți instrumente "explicative" model relațional polițiști pentru a vă valida interogările și pentru a crea indecși numai acolo unde sunt necesari Să ne imaginăm că o bancă elvețiană secretă □ nu ține evidența remitențelor: baza sa de date stochează pur și simplu soldul conturilor Să presupunem că cineva dorește să transfere bani din contul său în contul unui prieten din aceeași bancă În baza de date a băncii trebuie efectuate două operațiuni - suma de bani trebuie scăzută dintr-un sold și adăugată la celălalt Serverul bazei de date permite de obicei mai multor clienți să citească și să scrie date în același timp - executarea operațiunilor în modul serial ar face ca orice SGBD să fie prea lent Dar iată problema: dacă cineva cere soldul total al tuturor conturilor după înregistrarea scăderii, dar înainte de adăugarea corespunzătoare, atunci o sumă va lipsi Sau iată o opțiune mai proastă: ce se întâmplă dacă sistemul este dezactivat între aceste două operațiuni? Când serverul este din nou activ, va fi dificil să aflați motivul discrepanței în date Avem nevoie de modalități prin care SGBD fie să facă toate modificările care fac parte dintr-o operațiune în mai multe părți, fie să păstreze datele neschimbate În acest scop, sistemele de baze de date suportă tranzacții O tranzacție este o listă de operațiuni care trebuie efectuate atomic Tranzacțiile ușurează viața programatorului: în schimb, SGBD-ul este responsabil pentru asigurarea coerenței datelor Programatorului i se cere doar să încapsuleze operațiunile dependente în comenzi adecvate: ÎNCEPE TRANZACȚIA; UPDATE seif SET sold = sold + WHERE id= ; UPDATE seif SET sold = sold - WHERE id=l; COMIT; Operațiile atomice se efectuează într-un singur pas: nu pot fi finalizate la jumătate Capitolul Baze de date Rețineți: efectuarea de actualizări în mai multe părți fără tranzacții va crea mai devreme sau mai târziu inconsecvențe neregulate, imprevizibile și greu de găsit în datele dvs Bazele de date relaționale sunt grozave, dar au unele dezavantaje Pe măsură ce o aplicație crește în complexitate, tot mai multe tabele trebuie adăugate la baza de date relațională Solicitările devin din ce în ce mai puțin clare Și, cel mai important, din ce în ce mai des trebuie să apelezi la conexiuni ( IN), care necesită o cantitate mare de calcule și creează blocaje în sistem Ca rezumatul socilavil Modelul non-relațional nu utilizează relații tabulare Aproape niciodată nu vă solicită să combinați informații din mai multe înregistrări Deoarece SGBD-urile non-relaționale folosesc alte limbaje de interogare decât SQL, ele sunt numite și baze de date NoSQL Cel mai cunoscut tip de baze de date NoSQL sunt depozitele de documente Înregistrările sunt stocate în forma în care sunt Prin amabilitatea http://geek-and-poke com Model non-relațional cerute de cerere Orez Figura de mai jos compară modalitățile tabelare și documentare de stocare a postărilor de blog Date în modelul relațional (sus) vs date în NoSQL (jos) Ați observat că toate datele despre mesaj sunt copiate în înregistrarea corespunzătoare? Modelul non-relațional presupune posibilitatea duplicării informațiilor dacă este necesar Cu toate acestea, datele duplicat sunt dificil de actualizat în timp util și de a menține coerența Pe de altă parte, prin gruparea datelor relevante, un depozit de documente poate oferi mai multă flexibilitate: nu trebuie să concatenați șiruri; te poți descurca fără scheme fixe; fiecare intrare poate avea propria sa combinație de câmpuri Capitolul Baze de date Magazinele de documente nu au tabele sau rânduri deloc În schimb, există înregistrări numite documente Documentele conexe sunt grupate într-o colecție Documentele au un câmp cheie primară, astfel încât acestea pot fi legate între ele Dar operațiunile IN în magazinele de documente sunt ineficiente Uneori nici măcar nu sunt posibile, caz în care va trebui să urmăriți singur legăturile dintre documente Ambele sunt proaste - dacă documentele au date comune, acestea trebuie duplicate La fel ca bazele de date relaționale, bazele de date NoSQL creează indecși pe câmpuri cu o cheie primară De asemenea, puteți defini indecși suplimentari pentru câmpurile care sunt interogate sau sortate frecvent Stocarea cheie-valoare este cea mai simplă formă de stocare organizată a datelor Folosit în principal pentru stocarea în cache De exemplu, atunci când cineva solicită o anumită pagină web de la server, serverul trebuie să preia datele corespunzătoare din baza de date și să le folosească pentru a construi marcajul HTML pe care îl va vedea utilizatorul În locurile cu trafic intens, unde există mii de accese paralele, acest lucru devine imposibil Pentru a rezolva problema, folosim un magazin cheie-valoare ca mecanism de stocare în cache Cheia este adresa URL dorită, valoarea este marcajul HTML al paginii web corespunzătoare Data viitoare când cineva solicită aceeași adresă URL, HTML-ul final va fi pur și simplu preluat din magazinul cheie-valoare prin intermediul adresei cheie Dacă trebuie să efectuați o operațiune lentă din nou și din nou, care produce întotdeauna același rezultat, luați în considerare stocarea în cache Nu trebuie să utilizați Model non-relațional un depozit cheie-valoare, memoria cache poate fi, de asemenea, conținută în alte tipuri de baze de date Cu toate acestea, atunci când memoria cache este solicitată foarte frecvent, un sistem de stocare cheie-valoare este cea mai bună opțiune Într-o bază de date grafice, înregistrările sunt stocate ca vârfuri, iar legăturile sunt stocate ca muchii Nodurile nu sunt legate de o schemă fixă și pot conține date în diferite formate Structura graficului face eficientă lucrul cu înregistrările în funcție de relațiile lor Iată cum informațiile din Fig va arăta ca un grafic: Informații de blog stocate într-o bază de date grafică Capitolul Baze de date Acesta este cel mai flexibil tip de bază de date Scăpând de tabele și colecții, puteți stoca datele de rețea într-un mod intuitiv Dacă ar fi să desenați pe o tablă stațiile de metrou și stațiile de tranzit de suprafață, nu le-ați desena în formă tabelară Veți folosi cercuri, dreptunghiuri și săgeți Bazele de date grafice vă permit să stocați informații în acest fel Dacă datele dvs sunt ca o rețea, luați în considerare utilizarea unei baze de date grafice Acest tip de bază de date este util mai ales atunci când există multe relații importante între componentele de date Bazele de date grafice vă permit, de asemenea, să efectuați diferite tipuri de interogări orientate pe grafic De exemplu, dacă stocați datele despre transportul public într-un grafic, puteți solicita direct cea mai bună rută între două opriri într-un sens sau dus-întors Termenul recent popular "big data" descrie situații de prelucrare a datelor extrem de complexe în ceea ce privește volumul, viteza sau varietatea "Volumul" de date mari este, de exemplu, procesarea a mii de terabytes de informații în cazul LHC "Viteza" în raport cu big data înseamnă că trebuie să stocați un milion de înregistrări pe secundă fără întârziere sau să executați rapid miliarde de solicitări de citire "Diversitate" înseamnă că datele nu au o structură strictă, În cercurile profesionale, acestea se numesc "trei V": volum (volum), viteza (viteză) și varietate (varietate) Unii mai adaugă două aspecte: variabilitatea (schimbabilitatea) și veridicitatea (fiabilitatea), transformând termenul în "cinci V-uri" Large Hadron Collider, sau LHC, este cel mai mare accelerator de particule din lume În timpul experimentului, senzorii săi generează de terabytes de date pe secundă Model non-relațional și, prin urmare, devine foarte dificil să se ocupe de ele folosind baze de date relaționale tradiționale Ori de câte ori trebuie să căutați o abordare non-standard a gestionării datelor datorită volumului, vitezei sau varietății sale, puteți spune cu siguranță că aveți de-a face cu date mari Pentru a efectua unele experimente științifice moderne (de exemplu, cele legate de LHC sau SKA ), specialiștii fac deja cercetări în domeniul megadatelor, care implică stocarea și analiza a milioane de terabytes de informații Datele mari sunt adesea asociate cu bazele de date non-relaționale datorită flexibilității crescute a acestora Multe tipuri de aplicații de date mari sunt aproape imposibil de implementat cu bazele de date relaționale Bazele de date relaționale sunt centrate pe date: maximizează structurarea datelor și elimină duplicarea datelor, indiferent de modul în care este necesar Bazele de date non-relaționale, pe de altă parte, sunt orientate către aplicații: facilitează accesul la date și utilizarea acestora în funcție de nevoile dvs Am văzut că bazele de date NoSQL permit stocarea rapidă și eficientă a datelor mari, volatile și nestructurate Fără să vă faceți griji cu privire la schemele fixe și migrarea schemelor, vă puteți dezvolta soluțiile mult mai rapid Bazele de date non-relaționale sunt mai naturale și mai ușoare pentru mulți programatori Square Kilometer Array, sau SKA (Square Kilometer Array), este un grup de telescoape programat să devină operațional în Ei vor genera milion de terabytes de date în fiecare zi Capitolul Baze de date Cu toate acestea, amintiți-vă că, indiferent cât de mare este baza dvs non-relațională, este responsabilitatea dvs să actualizați informațiile duplicate în toate documentele și colecțiile Doar dumneavoastră trebuie să luați măsuri pentru a menține informațiile într-o stare consecventă Nu uitați: marea putere a acestor baze de date merge mână în mână cu o mare responsabilitate Există mai multe situații în care pentru a menține baza de date, nu un computer, ci mai multe, acționând în mod coordonat, trebuie să funcționeze Baze de date de câteva sute de terabytes Găsirea unui singur computer cu atât de mult spațiu de stocare este nerealist SGBD procesează câteva mii de solicitări simultane pe secundă Niciun computer nu are suficiente capacități de rețea sau de procesare pentru a face față unei astfel de sarcini Baze de date vitale, cum ar fi cele care înregistrează altitudinea și viteza unei aeronave într-un anumit spațiu aerian A te baza pe un singur computer în acest caz este prea riscant - dacă eșuează, baza de date va deveni inaccesibilă Pentru astfel de situații, există DBMS care pot rula pe mai multe calculatoare coordonate, formând baze de date distribuite Să ne uităm la cele mai comune modalități de a organiza astfel de baze de date Imediat după meciul final de la Cupa Mondială FIFA , Twitter a înregistrat o sarcină maximă de peste de tweet-uri pe secundă b model distribuit Un computer este gazda și primește toate solicitările către baza de date Este conectat la alte câteva computere slave Fiecare dintre ele conține o replică sau o copie a bazei de date Când masterul primește cereri de scriere, le transmite către slave, menținându-le sincronizate (Figura ) cerere de citire calculator gazdă computer slave # computer slave # scrie cererea computer slave # Baza de date distribuită cu un computer gazdă Cu această organizare, computerul gazdă este capabil să servească mai multe cereri de citire, deoarece le poate delega computerelor slave Sistemul devine mai fiabil: dacă computerul principal se defectează, mașinile slave se coordonează automat și selectează un nou computer principal Din acest motiv, sistemul nu încetează să funcționeze Dacă DBMS-ul dvs trebuie să gestioneze un număr mare de solicitări de scriere simultane, atunci un singur computer gazdă nu va putea face față sarcinii În acest caz, toate computerele din cluster devin master Un echilibrator de încărcare este utilizat pentru a distribui în mod egal cererile de citire și scriere primite între mașini (Figura ) Capitolul Baze de date Baza de date distribuită cu mai multe gazde Fiecare computer este conectat la toate celelalte din cluster Ei împărtășesc solicitările de scriere între ei, drept urmare toată lumea rămâne sincronizată Fiecare dintre ele are o copie a întregii baze de date Dacă baza de date primește multe solicitări de scriere cu cantități mari de date, poate fi extrem de dificil să o mențineți sincronizată peste tot în cluster Este posibil ca unele computere să nu aibă suficient spațiu pentru a găzdui toate datele O soluție este partajarea bazei de date între computere Deoarece fiecare dintre ele deține doar o parte din acesta, routerul direcționează cererile către mașina corespunzătoare (Fig ) Această configurație este capabilă să gestioneze mai multe solicitări de citire și scriere pentru baze de date foarte mari Dar poate exista o problemă cu ea: dacă o mașină dintr-un cluster eșuează, data pentru care a fost responsabil devine inaccesibilă Fragmentarea poate fi utilizată împreună cu replicarea pentru a reduce riscul (Figura ) b model distribuit Exemplu de fragmentare a bazei de date Solicitările sunt direcționate conform primei litere din actul de identitate solicitat cere router t eu AF GL M-R SZ | ■ ■ ■ ■ II computer gazdă # computer gazdă # computer gazdă # computer gazdă # | ■ Eu ■ ■ ■ computer slave computer slave computer slave I computer slave | Eu ■ Eu ■ ■ ■ Eu | computer slave computer slave computer slave I computer slave | Baza de date fragmentată cu trei replici per fragment Capitolul Baze de date În acest caz, fiecare fragment este executat de un cluster master-slave Acest lucru mărește și mai mult capacitatea SGBD de a servi cererile de citire Și dacă unul dintre serverele master din fragment este deconectat de la rețea, dispozitivul slave îi ia automat locul - acest lucru asigură că sistemul nu se destramă și nu pierde date Actualizările la bazele de date distribuite replicate care sunt efectuate pe o singură mașină nu sunt propagate imediat în toate copiile Durează ceva timp până când toate computerele din cluster sunt sincronizate Acest lucru poate rupe consistența datelor dvs Să presupunem că vindeți bilete la film online Traficul este prea mare, așa că baza de date este răspândită pe două servere Alice cumpără un bilet pe serverul A Bob este servit de serverul B și vede același bilet gratuit Înainte ca informațiile despre achiziția lui Alice să ajungă la serverul B, Bob va plăti și acest bilet Acum cele două servere au inconsecvențe de date Pentru a remedia situația, va trebui să anulați una dintre vânzări și să vă cereți scuze fie unei Alice nemulțumite, fie unui Bob nemulțumit Sistemele de baze de date conțin adesea instrumente pentru a reduce inconsecvența datelor De exemplu, undeva vi se permite să faceți interogări care impun coerența datelor în întregul cluster Cu toate acestea, acest lucru reduce performanța SGBD Acest lucru este valabil mai ales pentru tranzacții: pot cauza probleme serioase de performanță în bazele de date distribuite, deoarece forțează toate mașinile din cluster să se coordoneze cu cantități potențial mari de informații blocate Există un compromis între consistență și performanță Dacă interogările bazei de date nu necesită conformitate Modelul geografic consecvență strictă a datelor, atunci se spune că funcționează sub o potențială consistență Se garantează că datele vor fi consistente în cele din urmă, adică în timp Aceasta înseamnă că unele solicitări de scriere pot fi respinse, iar unele solicitări de citire pot returna informații învechite În multe cazuri, a face față cu potențiala consistență nu reprezintă o mare problemă De exemplu, este în regulă dacă pagina dvs de produs arată de recenzii în loc de , deoarece una dintre ele tocmai a fost făcută Multe baze de date stochează informații geografice, cum ar fi locația orașelor sau poligoanele care descriu granițele naționale Aplicațiile de transport pot avea nevoie de o diagramă de cablare pentru autostrăzi, căi ferate și gări Biroul de recensământ trebuie să stocheze mii de zone de recensământ sub formă de hartă, împreună cu datele de recensământ pentru fiecare dintre ele Ceea ce este interesant la astfel de baze de date este executarea de interogări împotriva informațiilor spațiale De exemplu, dacă conduceți un serviciu de ambulanță, atunci aveți nevoie de o bază de date cu locația spitalelor din zonă SGBD-ul dvs trebuie să poată returna rapid cel mai apropiat spital în raport cu orice locație dată Astfel de aplicații au marcat dezvoltarea unor SGBD speciale numite sisteme de informații geografice (GIS) Acestea conțin câmpuri special concepute pentru date geografice: PointField (punct), LineField (linie dreaptă), PolygonField (poligon), etc Și sunt capabili să efectueze interogări spațiale pe aceste câmpuri Conform GIS-ului râurilor și orașelor, tu Capitolul Baze de date puteți face direct interogări de genul: "Orașe pe o rază de mile de râul Mississippi, sortate după populație" Un GIS folosește indici spațiali și, prin urmare, căutările de proximitate spațială sunt foarte eficiente Vârsta medie în SUA Aceste sisteme vă permit chiar să definiți constrângeri spațiale De exemplu, într-un tabel care stochează informații despre parcele, puteți seta o constrângere ca două parcele să nu se suprapună Acest lucru va proteja agențiile de carte funciară de un număr mare de probleme Multe SGBD-uri cu scop general oferă extensii GIS Ori de câte ori trebuie să vă ocupați de date geografice, asigurați-vă că utilizați un motor de baze de date activat pentru GIS și folosiți funcționalitatea acestuia pentru a crea interogări mai inteligente Aplicațiile GIS sunt adesea folosite în viața de zi cu zi, de exemplu în navigatoarele GPS precum Google Maps sau Waze Conform https://census gov Formate de serializare Cum se stochează datele în afara bazei de date într-un format compatibil cu diferite sisteme? De exemplu, putem dori să duplicăm datele sau să le exportăm într-un alt sistem În acest scop, datele trebuie să treacă printr-un proces de serializare, în timpul căruia vor fi convertite conform formatului de codificare Fișierul rezultat va fi citit de orice sistem care acceptă acest format Să trecem pe scurt peste câteva formate care sunt utilizate pe scară largă pentru serializarea datelor este cel mai comun format de serializare pentru bazele de date relaționale Scriem o serie de comenzi SQL care reproduc baza de date și toate detaliile acesteia Majoritatea sistemelor de baze de date relaționale includ comanda DUMP pentru a crea un dump de bază de date serializat SQL Acestea conțin, de asemenea, o comandă RESTORE pentru a încărca un astfel de fișier dump înapoi în DBMS este o altă modalitate de a reprezenta datele structurate, dar nu depinde de modelul relațional sau de implementarea SGBD Formatul XML a fost creat pentru a fi compatibil cu o varietate de sisteme de calcul și pentru a descrie structura și complexitatea datelor Unii spun că XML a fost conceput de oameni de știință care nu și-au dat seama că crearea lor nu a fost foarte practică este un format de serializare spre care dezvoltatorii din întreaga lume converg din ce în ce mai mult Poate reprezenta date relaționale și non-relaționale într-un mod care este intuitiv pentru programatori Există multe extensii pentru JSON: BSON (JSON binar) vă oferă cea mai eficientă procesare a datelor; JSON-LD aduce puterea structurii XML la JSON , sau fișierul separat prin virgulă, este probabil cel mai simplu format de schimb de date Datele sunt stocate aici ca text, o înregistrare pe linie Câmpurile din înregistrare sunt separate printr-o virgulă sau un alt caracter care nu se găsește în date Formatul CSV este util pentru descărcarea bazelor de date simple, dar nu este potrivit pentru reprezentarea datelor complexe Capitolul Baze de date În acest capitol, am învățat că structurarea informațiilor dintr-o bază de date este extrem de importantă pentru a face datele utile Am explorat diferite moduri în care se face acest lucru Am văzut cum modelul relațional separă datele în tabele și cum sunt legate între ele folosind relații Majoritatea programatorilor învață să lucreze doar cu modelul relațional, dar am depășit asta Am văzut moduri alternative, non-relaționale de structurare a datelor Am discutat despre problemele legate de consistența datelor și despre cum să le atenuăm prin tranzacții Am căutat modalități de scalare a unui SGBD pentru a gestiona sarcinile de lucru intensive folosind o bază de date distribuită De asemenea, am aflat despre GIS și funcționalitatea pe care acestea le oferă pentru lucrul cu date geografice De asemenea, am învățat modalități comune de a partaja date între diferite aplicații Și, în sfârșit (cu excepția cazului în care experimentați), alegeți un SGBD utilizat pe scară largă Este mai productiv și conține mai puține erori Nu există un sistem perfect de gestionare a bazelor de date Niciun SGBD nu este potrivit pentru orice, fără excepție, scenarii După ce ați citit acest capitol, aveți acum o mai bună înțelegere a diferitelor tipuri de SGBD și a caracteristicilor acestora, astfel încât să puteți face o alegere informată despre care să utilizați Concepte de sistem de baze de date (Silberschatz, vezi https://code energy/silber) Sadalaj P J , Fowler M NoSQL Nouă metodologie pentru dezvoltarea bazelor de date non-relaționale Principiile sistemelor de baze de date distribuite (Ozsu, vezi https://code energy/ozsu) Orice tehnologie suficient de avansată nu se poate distinge de magie Arthur Clark Au fost inventate nenumărate și variate mașini pentru a rezolva probleme Există multe tipuri de computere, de la cele încorporate în roboții care cutreieră Marte până la cele care controlează sistemele de navigație ale submarinelor nucleare Aproape toate computerele, inclusiv laptopurile și telefoanele noastre, funcționează pe același principiu ca prima mașină de calcul inventată de von Neumann în Știți cum sunt făcute computerele? În acest capitol veți învăța: III înțeleg elementele de bază ale arhitecturii computerelor', G alegeți un compilator pentru a traduce codul sursă într-un limbaj de calculator; x s schimbă memoria pentru performanță folosind o ierarhie de memorie La urma urmei, programarea ar trebui să arate ca o magie doar pentru non-programatori, nu pentru tine și pentru mine Capitolul Calculatoare Un computer este o mașină care respectă comenzile care controlează datele Are două componente principale: procesor și memorie Memoria, aka RAM , este locul unde scriem comenzi De asemenea, stochează datele pe care operează computerul Procesorul, sau CPU , primește instrucțiuni și date din memorie și efectuează calculele corespunzătoare Să înțelegem cum funcționează aceste două componente Memoria este împărțită în mai multe celule Fiecare stochează o cantitate mică de date și are o adresă numerică Citirea sau scrierea datelor în memorie se realizează prin operații care acționează pe o celulă odată Pentru a citi sau scrie într-o locație de memorie, trebuie să transmitem adresa numerică a acesteia (Figura ) Mesaj pentru ca RAM să efectueze operația în celula # ( ) Memorie cu acces aleatoriu (RAM engleză, memorie cu acces aleatoriu) Un nume mai precis în rusă este un dispozitiv de stocare cu acces aleatoriu (memorie), abreviat ca ZUPD (PDD) Unitate centrală de procesare (CPU în engleză, unitate centrală de procesare) Arhitectură Deoarece memoria este un circuit electric, transmitem adresele celulelor prin cablu ca numere binare Fiecare fir transmite o cifră binară O tensiune înaltă corespunde unui semnal "unu", iar o tensiune joasă corespunde unui semnal "zero" adresa celulei date noi de celule adresa celulei datele curente ale celulei Memoria poate funcționa în modul citire sau scriere Memoria este capabilă să efectueze două operații cu adresa celulei: obțineți valoarea stocată în ea sau scrieți una nouă Memoria are un contact de intrare special pentru setarea modului său de funcționare (Fig ) Fiecare celulă de memorie stochează un număr binar de biți numit octet În modul de citire, memoria primește octetul stocat în celulă și îl scoate de-a lungul a opt fire care transmit date (Fig ) Când memoria este în modul de scriere, primește un octet pe aceste fire și îl scrie în locația specificată (Figura ) Un grup de fire folosite pentru a transfera aceleași date se numește magistrală Opt fire pentru transmiterea adreselor formează- Numerele binare sunt exprimate în baza Anexa I explică cum trebuie înțeles acest lucru Capitolul Calculatoare magistrala de adrese ruyut Celelalte opt, folosite pentru a transfera informații către și de la celulele de memorie, formează o magistrală de date Autobuzul de adrese este unidirecțional (utilizat doar pentru a primi date), în timp ce magistrala de date este bidirecțională (folosit pentru a trimite și primi date) datele recuperate Citirea numărului de la adresa celulei datele stocate Scrierea numărului la adresa celulei Arhitectură În orice computer, CPU și RAM schimbă în mod constant date: procesorul selectează comenzi și date din memorie și, uneori, stochează date pentru ieșire și rezultatele intermediare ale calculelor acolo (Fig ) fir de comandă CPU conectat la RAM CPU are mai multe locații interne de memorie numite registre Poate efectua operații matematice simple asupra numerelor stocate în aceste registre De asemenea, poate muta date între registre și RAM Iată exemple de operații tipice pe care CPU-ul trebuie să le efectueze: copiați datele din celula de memorie nr în registrul nr ; adăugați numărul din registrul # cu numărul din registrul # Setul de operațiuni pe care le poate efectua un procesor se numește setul său de instrucțiuni Fiecărei operații din setul de instrucțiuni i se atribuie un număr Codul mașinii este în esență o succesiune de numere, reprezentate Capitolul Calculatoare controlul operațiunilor procesorului central Sunt stocate ca numere în RAM Stocăm datele de intrare/ieșire, rezultatele intermediare și codul mașinii - toate amestecate - în RAM Orez Figura arată cum unor instrucțiuni ale procesorului li se atribuie numere așa cum apar în manualele CPU Pe măsură ce tehnologia de producție s-a îmbunătățit, procesoarele au început să accepte operațiuni suplimentare Setul de instrucțiuni al procesoarelor moderne este imens Cu toate acestea, cele mai importante operațiuni existau deja cu câteva decenii în urmă Set de instrucțiuni INSTRUCȚIUNI DE BAZĂ MNEMONIC D OPR Dj Di Dq OPA Dj Dg Dj Dq DESCRIEREA OPERAȚIUNII NOP INC RRRR Incrementează conținutul registrului RRRR ADO RRRR Adăugați conținutul registrului RRRR la acumulator cu carry LD RRRR Încărcați conținutul registrului RRRR la acumulator LDM DDDD Încărcați datele DDDD în acumulator CLC Purtare clară IAC Acumulator de incrementare DAC Acumulator de decrement O parte a foii de date Intel care arată modul în care numerele sunt mapate la operațiuni A fost primul procesor din lume, lansat în CPU rulează într-o buclă nesfârșită, preluând și executând în mod constant instrucțiuni din memorie În centrul ciclului se află registrul PC sau contorul Codul programului se poate modifica chiar și prin includerea instrucțiunilor care rescriu părți din propriul cod în RAM Nu este neobișnuit ca virușii de computer să facă acest lucru pentru a face dificilă detectarea lor de către software-ul antivirus O paralelă uimitoare poate fi făcută aici cu virușii biologici care își schimbă ADN-ul pentru a se ascunde de sistemul imunitar al gazdei Arhitectură comenzi Acesta este un registru special care deține adresa de memorie a următoarei instrucțiuni care urmează să fie executată Iată ce face CPU-ul: ) selectează o comandă la adresa de memorie specificată de registrul RS; ) crește PC-ul cu ; ) execută comanda; ) revine la pasul Când CPU este pornit, PC-ului i se dă o valoare implicită, adică adresa primei instrucțiuni executate de mașină Acesta este de obicei un program firmware nemodificabil responsabil pentru încărcarea funcțiilor de bază ale unui computer Odată pornit, procesorul trece prin această buclă nesfârșită de preluare și execuție până când opriți computerul Cu toate acestea, dacă procesorul ar putea efectua doar o listă ordonată, secvenţială de operaţii, atunci computerul nu ar fi altceva decât un calculator avansat CPU este uimitor deoarece poate fi instruit să scrie o nouă valoare în registrul PC-ului, determinând procesul de execuție a instrucțiunii să sară - să "sare" în altă parte în memorie O astfel de ramură poate fi o expresie condiționată De exemplu, o instrucțiune CPU ar putea spune: "Scrieți adresa # pe computer dacă registrul # este zero" Acest lucru permite computerelor să execute instrucțiuni precum următoarele: dacă x = compute this() # calculează acest eLse compute that() # calculează asta Asta e tot ce trebuie să știi Indiferent dacă deschideți un site web, jucați un joc pe computer sau editați o foaie de calcul, dvs Nu confundați această abreviere cu acronimul comun pentru Personal Computer (PC) - "personal computer" În multe computere personale, acest program se numește BIOS (în engleză, sistem de intrare/ieșire de bază, "sistem de intrare/ieșire de bază") Capitolul Calculatoare numerele sunt întotdeauna aceleași: sunt o serie de operații simple care pot doar adăuga, compara sau muta date în memorie Cu multe dintre aceste operații simple, pot fi exprimate proceduri complicate De exemplu, codul pentru jocul clasic Space Invaders (Figura ) include aproximativ de instrucțiuni ale mașinii Space Invaders, lansat în , este considerat de mulți ca fiind cel mai influent joc din toate timpurile În anii , Space Invaders a devenit extrem de popular Oamenii l-au jucat pe sloturi echipate cu procesoare de MHz Acest indicator este numărul de operații de bază pe care procesorul le efectuează pe secundă Un procesor de MHz efectuează aproximativ milioane de operații de bază pe secundă Sunt necesare cinci până la zece operațiuni de bază pentru a executa o instrucțiune de mașină În consecință, aparatele de slot de epocă executau sute de mii de comenzi pentru mașini în fiecare secundă Arhitectură Odată cu progresul tehnologic de astăzi, computerele desktop și smartphone-urile convenționale au, de obicei, procesoare tactate la GHz Sunt capabili să execute sute de milioane de instrucțiuni ale mașinii în fiecare secundă Și recent, procesoarele multi-core au fost utilizate pe scară largă Un procesor quad-core de GHz poate executa aproape un miliard de instrucțiuni pe secundă Și se pare că procesoarele noastre vor avea din ce în ce mai multe nuclee în viitor Te-ai întrebat vreodată de ce nu poți introduce un CD Sony PlayStation în computerul tău desktop și nu poți începe să joci? Sau de ce aplicațiile iPhone nu vor rula pe Mac? Motivul este simplu: arhitecturi diferite ale CPU Arhitectura x este destul de standard în zilele noastre, așa că același cod poate rula pe majoritatea computerelor personale Cu toate acestea, telefoanele mobile, de exemplu, au procesoare cu o arhitectură diferită, mai eficientă din punct de vedere energetic Arhitecturi diferite înseamnă seturi diferite de instrucțiuni ale procesorului și, prin urmare, moduri diferite de a le codifica cu numere Numerele care sunt transmise ca comenzi către CPU de pe computerul dvs desktop nu sunt comenzi valide către CPU de pe telefonul dvs mobil și invers Primul procesor numit Intel a fost bazat pe o arhitectură pe biți Aceasta înseamnă că ar putea opera cu numere binare (suma, compara, muta) până la cifre într-o instrucțiune de mașină Autobuzul de date și magistrala de adrese de pe Intel constau din doar patru fire fiecare La scurt timp după aceea, procesoarele pe biți s-au răspândit Au fost folosite la primele computere personale care rulau DOS Joc Whoa, popular în anii și Un procesor cu de nuclee a fost anunțat de cercetători în Sistem de operare pe disc Vom vorbi mai multe despre sistemele de operare în curând Capitolul Calculatoare computer portabil de jocuri, avea și un procesor pe biți O singură instrucțiune în astfel de procesoare poate funcționa pe numere binare de biți Progresele tehnologice rapide au permis arhitecturii pe biți și apoi pe de biți să domine Capacitatea registrelor CPU a fost crescută la de biți Pentru registre mai încăpătoare, a fost firesc necesar să se extindă magistralele de date și adrese Autobuzul de adrese cu de fire poate adresa de octeți ( GB) de memorie Și atunci setea noastră de putere de calcul a devenit de neoprit Programele de calculator au devenit rapid mai complexe și au folosit din ce în ce mai multă memorie GB RAM este prea puțin Și accesarea memoriei mai mari cu adrese numerice care se potrivesc în registrele de de biți a devenit un proces descurajan Aceasta a marcat apariția arhitecturii pe de biți care domină astăzi Procesoarele pe de biți pot gestiona numere extrem de mari într-o singură instrucțiune În același timp, registrele pe de biți stochează adrese într-un spațiu de memorie imens - de octeți, ceea ce înseamnă mai mult de miliarde de gigaocteți Unii designeri de computere au considerat util să stocheze numerele în RAM și CPU de la stânga la dreapta (de la biții mai puțin semnificativi la cei mai semnificativi), într-un mod cunoscut sub numele de big endian Alții au ales să scrie datele de la dreapta la stânga, într-un mod numit big endian Secvența binară - - - - - - - poate reprezenta numere diferite în funcție de ordinea octeților: little endian: + + ° = ; Little Endian: ° + + = Cele mai multe procesoare de astăzi sunt big endian, dar există multe computere little endian Dacă datele generate de un procesor little endian vor fi interpretate de un procesor little endian, atunci nu Compilatoare trebuie avut grijă pentru a evita nepotrivirile de endianness Programatorii care manipulează numerele binare în mod direct, în special atunci când analizează datele care ies din comutatoarele de rețea, ar trebui să țină cont de acest lucru Chiar dacă majoritatea computerelor de astăzi sunt big endian, traficul pe Internet a standardizat Little Endian deoarece majoritatea routerelor de rețea timpurii aveau procesoare corespunzătoare Datele de comandă directă vor fi denaturate dacă sunt citite ca și cum ar fi în ordine inversă și invers Uneori este util să rulați un cod pe computer care a fost proiectat pentru un alt CPU Acest lucru vă permite să testați aplicația pentru iPhone fără un iPhone sau să jucați jocul dvs de epocă Super Nintendo preferat Pentru aceste sarcini, există componente software numite emulatori Emulatorul imită mașina țintă: computerul pretinde că are același CPU, RAM și alt hardware Comenzile sunt decodificate de programul emulator și executate pe mașina emulată După cum înțelegeți, este foarte dificil să emulați o mașină în alta atunci când au arhitecturi diferite Dar pentru că computerele noastre sunt mult mai rapide decât cele vechi, a devenit posibil Dacă obțineți un emulator Game Wow și lăsați computerul să creeze o consolă de jocuri virtuală, puteți juca jocuri la fel ca într-un Game Wow adevărat Programăm computere să facă RMN, să recunoască vorbirea, să exploreze planete îndepărtate și să facă multe alte sarcini complexe În mod surprinzător, tot ceea ce este capabil un computer se face în cele din urmă prin instrucțiuni simple ale procesorului care pur și simplu adună și compară numere Aplicațiile complexe, cum ar fi browserul de internet, necesită milioane sau miliarde de astfel de instrucțiuni ale mașinii Capitolul Calculatoare Dar rareori scriem programe direct ca instrucțiuni CPU Este imposibil ca un om să scrie un joc realist pe computer D în acest fel Pentru a-și exprima prescripțiile într-un mod mai natural și mai compact, oamenii au creat limbaje de programare Scriem cod în aceste limbi și apoi folosim un program numit compilator pentru a traduce instrucțiunile noastre în instrucțiuni de mașină pe care procesorul le poate înțelege Pentru a explica ce face un compilator, să folosim o analogie matematică simplă Dacă vrem să cerem cuiva să calculeze factorialul de , putem pune întrebarea: ! = ? Cu toate acestea, dacă persoana pe care o întrebăm nu știe ce este un factorial, atunci întrebarea nu va avea sens Va trebui să o reformulăm folosind operații mai simple: x x x x =? Ce se întâmplă dacă persoana pe care o întrebăm știe doar să rezuma? Va trebui să ne simplificăm și mai mult expresia: + + + + + + + + + + + + + + + + + + + + + + + = ? Pe măsură ce ne rescriem calculul într-o formă din ce în ce mai simplă, sunt necesare din ce în ce mai multe operații Același lucru este valabil și pentru codul mașinii Compilatorul traduce instrucțiuni complexe ale limbajului de programare în instrucțiuni CPU echivalente Folosind capabilitățile puternice ale bibliotecilor externe, exprimăm programe complexe constând din miliarde de instrucțiuni CPU, prin Limbajele de programare vor fi discutate mai detaliat în secțiunea următoare capitol Compilatoare datorită unui număr relativ mic de linii de cod care sunt de înțeles și ușor de modificat Alan Turing, fondatorul computerului, a descoperit că mașinile simple pot calcula orice ar putea fi calculat în principiu Pentru a avea capabilități de calcul universale, o mașină trebuie să fie capabilă să execute un program care conține instrucțiuni: citirea și scrierea datelor în memorie; ramură condiționată (dacă adresa de memorie are o valoare dată, atunci mergeți la alt punct din program) Mașinile care au capacități de calcul universale se numesc Turing-complete Indiferent cât de lung sau complicat este un calcul, acesta poate fi întotdeauna exprimat în termeni de instrucțiuni simple de citire/scriere și sărituri Având suficient timp și memorie, aceste instrucțiuni pot calcula orice S-a demonstrat recent că instrucțiunea CPU numită MOV ("mutare") este Turing completă Aceasta înseamnă că un procesor care execută doar instrucțiunea MOV este capabil să facă tot ce poate un procesor cu drepturi depline Cu alte cuvinte, este foarte posibil să exprimați orice tip de cod de program exclusiv folosind instrucțiunea MOV Cea mai importantă concluzie din această știre este că, dacă un program poate fi scris într-un limbaj de programare, atunci poate fi rescris pentru a rula pe orice mașină Turing-completă, oricât de simplu este Un compilator este un program magic care traduce automat codul dintr-un limbaj complex într-unul mai simplu Puteți arunca o privire la un compilator care transformă orice cod C în cod binar cu o singură instrucțiune de mașină, mo: https://code energie/mov ([ оіі )гаі! i, )оѵ )([іі oHeașoijf ț iqdaiOiquHO" •[ eseirj Compilatoare Programele de calculator compilate sunt în esență secvențe de instrucțiuni CPU După cum am aflat, codul compilat pentru un computer desktop nu va funcționa pe un smartphone, deoarece aceste mașini au arhitecturi de procesoare diferite Dar este posibil ca programul compilat să nu ruleze pe unul dintre cele două computere care au aceeași arhitectură CPU Cert este că programele, pentru a rula fără probleme, trebuie să interacționeze cu sistemul de operare (OS) al computerului Pentru a comunica cu lumea exterioară, programul trebuie să introducă și să scoată informații: deschide fișiere, scrie mesaje pe ecran, stabilește o conexiune la rețea și așa mai departe Dar computerele diferite au hardware diferit Programul în sine nu este capabil să accepte toate tipurile existente de ecrane, plăci de sunet sau plăci de rețea De aceea programele se bazează pe sistemul de operare pentru munca lor Datorită ajutorului ei, lucrează cu ușurință cu diverse hardware Programele efectuează apeluri speciale de sistem pentru ca sistemul de operare să efectueze operațiunile I/O necesare Compilatorii traduc comenzile I/O în apeluri de sistem adecvate Cu toate acestea, diferite sisteme de operare folosesc adesea apeluri de sistem incompatibile Apelul de sistem pentru a imprima ceva pe ecran este diferit în Windows decât în Mac OS sau Linux Acesta este motivul pentru care, dacă compilați un program pentru a rula pe Windows cu un procesor x , acesta nu va rula pe un Mac cu același procesor Codul de program compilat trebuie să fie orientat nu numai către o arhitectură specifică a procesorului, ci și către un anumit sistem de operare Capitolul Calculatoare Compilatorii buni încearcă să optimizeze codul mașină pe care îl generează Dacă văd că părți din codul tău pot fi înlocuite cu echivalente mai eficiente, o vor face Compilatorii aplică uneori sute de reguli de optimizare înainte de a produce cod binar De aceea nu ar trebui să sacrifici lizibilitatea codului în favoarea micro-optimizării acestuia Compilatorul va aplica cumva toate optimizările banale Uită-te la această bucată de cod: factorial de funcție (n) dacă n > returnează factorial(n - ) * n eise întoarce Cineva va spune că este mai bine să-l înlocuiți cu acest echivalent: factorial de funcție (n) rezultat - când n > rezultat "- rezultat*n n "- n - returnează rezultatul Da, executarea procedurii factoriale fără recursivitate utilizează mai puține resurse de calcul Dar acesta nu este un motiv pentru a schimba codul programului Compilatoarele moderne vor rescrie automat funcții recursive simple Iată un alt exemplu: i "- x + y + j "- x + y Compilatorii vor scăpa de recalcularea lui x + y și vor face această conversie: Compilatoare tl "- x + y i "- tl + j cel mai bun profit sell day "- s buy day "- b best profit "- profit profit (sell day, buy day) Ideea este că nu trebuie să păstrăm cea mai bună zi de cumpărare pentru fiecare zi la intrare Este suficient să stocați cea mai bună zi de cumpărare față de cea mai bună zi de vânzare găsită până acum Vladston Ferreira Philo Tradus din engleză de A Logunov director editorial Editor principal Editor științific Redactor literar Redactor de artă Correctori Aspect Y Sergienko K Tultseva A Kiselev A Petrov S Petrov N Sidorova, G Shkatova L Egorova Fabricat in Rusia Producător: OOO Progress Book Locația și adresa actuală: " Rusia, Sankt Petersburg, st Radishcheva, , k D, birou Tel : + Data fabricatiei: Nume: producție de carte Termen de valabilitate nelimitat Beneficiu fiscal - clasificator de produse în întregime rusesc OK - , - Cărți tipărite profesionale, tehnice și științifice Importator în Belarus: SRL "PITER M", Republica Belarus, , Minsk, st Timiryazeva, / , birou , tel /fax Semnat pentru publicare la Format x / Hartie offset Conv p l Tiraj Ordin Tipărit la OJSC "Prima Tipografie Exemplar" Filiala "Tipografie Cehov" , regiunea Moscova, Cehov, st imprimante, Site: www chpk ru E-mail: marketing@chpk ru Fax: ( ) - - , telefon: ( ) - - CASA PZDATELSKY CARTEA TA UNICA Vrei să-ți publici cartea? Va fi un cadou ideal pentru parteneri și prieteni, un instrument excelent pentru promovarea mărcii dvs , un cadou pentru evenimente memorabile! Vom putea implementa orice, chiar și cele mai îndrăznețe și complexe, idei și proiecte NOI OFERIM: • publică-ți cartea • publicarea unei cărți pentru utilizare în activități de marketing • cărți ca cadouri corporative • publicitate în cărți • ediţia bibliotecii corporative De ce ne alegeți: Editura "Piter" are peste de ani Experiența noastră este o garanție a calității înalte Noi oferim: • servicii de procesare și finalizare a textului dumneavoastră • design modern de la profesioniști • nivel ridicat de performanță de imprimare • vânzarea cărții dumneavoastră în toate librăriile din țară Vom asigura promovarea cărții dvs : • publicitate în mass-media de specialitate și puncte de vânzare • recenzii în publicații de carte de top • Suport pe internet pentru o campanie de publicitate Avem propria noastră rețea de distribuție în toată Rusia, precum și în Ucraina și Belarus Colaborăm cu cele mai mari librării Editura "Peter" este un participant regulat la multe conferințe și seminarii, care oferă o oportunitate largă de a vinde cărți Ne vom asigura că cartea dvs este disponibilă în mod constant în magazine și postată în cele mai importante locuri Vom oferi o abordare individuală fiecărui client, design exclusivist, orice tiraj În plus, vă sugerăm să lansați o carte electronică Îl vom plasa în cele mai mari magazine online Cartea va fi produsă în format ePub sau PDF - cele mai populare și de încredere formate de astăzi Contactați-ne chiar acum: St Petersburg - Anna Titova, ( ) - - , titova@piter com Moscova - Sergey Klebanov, ( ) - - , klebanov@piter com 